用户故事

南卡罗莱纳医科大学应用生物信息学理论

挑战

促进计算生物学研究,使学生和生物学家通过数学建模应用理论

解决方案

使用MathWorks工具分析实验数据,开发算法,并使用现有的开源技术

结果

  • 著名的科研补助金
  • 对学生学习效率高
  • 更短的计算时间

“MATLAB使年轻的生物学家能够学习足够的编程和数学,而不用害怕代码。他们可以用MATLAB写东西,就像用英语一样。”

乔纳斯·阿尔梅达博士,南卡罗莱纳医科大学
二维凝胶分析。

分子生物学的进步正在产生空前数量的数据。这些数据包含了关于基因、蛋白质和代谢物的结构和动力学的丰富信息,但为了提取和解释这些信息,研究人员必须将新兴理论与计算方法和数学模型结合起来。

南卡罗莱纳医科大学(MUSC)生物统计、生物信息学和流行病学系的研究人员使用MathWorks工具将基因组和代谢数据合并到系统模型中,以测试假设。该大学还使用MathWorks工具支持该系在基因组学、蛋白质组学和生物信息学,如系统生物学、代谢建模和多元统计。

“算法识别的动力植根于生物学,因此我们的生物学家必须开发快速原型应用程序,”MUSC生物信息学副教授乔纳斯·阿尔梅达博士说。“MATLAB提供了一个用户友好的环境,使我们能够快速、轻松地从理论到应用。”

挑战

该部门的研究团队为求解常微分方程系统、图像处理、统计分析、优化和序列对齐寻找了一个健壮的数学建模环境。

环境将需要与他们现有的网络技术、开源软件和来自国家生物技术信息中心(NCBI)的数据集成。

因为生命科学家通常缺乏数学建模软件的经验,环境也需要易于学习和使用。

解决方案

在考虑了许多商业和开源的数学建模工具后,小组选择了MATLAB®因为它易于使用、互操作性、行业接受性以及丰富的建模和计算能力。

小组内的研究团队使用MATLAB开发基因组和蛋白质组学分析的应用程序,如生物标志物识别、二维凝胶分析和人工神经网络。他们使用MATLAB web Server将这些软件包通过网络提供给其他团体和科学界。世界杯预选赛小组名单

MATLAB、统计和机器学习工具箱™和优化工具箱™为该小组的大部分工作提供了基础。“MATLAB是我们运作能力的核心。我们所做的一切都使用统计和机器学习工具箱。我们还使用优化工具箱,通过结合遗传算法的神经网络跟踪状态变量来进行数值解耦。”Almeida说。

该小组使用生物信息学工具箱™简化序列比对使用Needleman-Wunsch和Smith-Waterman算法。该工具箱还使他们能够规范化、可视化和导入微阵列,包括来自NCBI的基因表达集合的数据。他们还使用MATLAB中的SOAP客户机与Internet上的本地和公共数据进行交互。

MUSC使用小波工具箱™和图像处理工具箱™去噪和识别二维凝胶样品中的蛋白质簇。

在生化系统理论领域,研究人员使用符号数学工具箱™对非线性微分方程系统进行数值解耦和重铸。

他们还使用MATLAB对其他开源技术进行系统调用,包括PostgreSQL数据库和统计包R,并对结果进行解析。

阿尔梅达说:“生物信息学社区对开源工具有强烈的偏见,但我们真的相信MATLAB可以与开源工具世界杯预选赛小组名单相提并论,因为我们开发的代码有一个开放的架构,所以任何人都可以看到源代码。”“我不记得有一篇论文因为我使用了MATLAB而没有被接受。”

MUSC的研究人员计划继续使用MathWorks工具开发基因组、转录组和蛋白质组分析的应用程序。

结果

  • 著名的科研补助金.MathWorks工具帮助该系获得了资助,包括国家医学图书馆仅有的15个生物信息学培训资助中的一个,以及国家心肺和血液研究所蛋白质组学中心仅有的10个奖项中的一个。阿尔梅达说:“图像在赢得赠款方面发挥着重要作用。“凝胶的彩色图片显示了侧面的蛋白质组斑点簇,这产生了很大的影响。使用MathWorks工具,我们可以在几分钟内完成。”

  • 对学生学习效率高.“生物专业的学生可以用MATLAB很容易地学习动态规划,”Almeida解释道。“我们基本上有一个学期的时间来训练它们,用MATLAB就足够了。”

  • 更短的计算时间.利用MATLAB和微分方程解耦系统的技术,该小组加快了从代谢或蛋白质组时间序列数据确定路径结构的过程。在使用MATLAB的单台机器上,他们在不到15分钟的时间内完成了这个过程。在数百个处理器的集群上使用大量并行处理的方法需要数小时才能产生结果。

南卡罗来纳医科大学是世界上1300所大学中的一所,提供了MATLAB和Simulink的校园访问。有了校园级许可证,研究人员、教师和学生可以访问最新版本级别的产品的公共配置,以便在任何地方使用——在教室、在家里、在实验室或在现场。2022世界杯八强谁会赢?

Baidu
map