用户故事

南卡罗来纳医科大学应用生物信息学理论

挑战

通过使学生和生物学家通过数学建模应用理论来推进计算生物学研究

解决方案

使用MathWorks工具分析实验数据,开发算法,并使用现有的开源技术

结果

  • 著名研究基金
  • 学生生产力高
  • 更短的计算时间

“MATLAB使年轻的生物学家能够学习足够的编程和数学,而不用害怕代码。他们可以用MATLAB写东西,就像写英语一样。”

乔纳斯·阿尔梅达博士,南卡罗来纳医科大学
二维凝胶分析。

分子生物学的进步正在产生前所未有的大量数据。这些数据包含了关于基因、蛋白质和代谢物的结构和动态的丰富信息,但要提取和解释这些信息,研究人员必须将新兴理论与计算方法和数学模型结合起来。

南卡罗来纳医科大学(MUSC)生物统计、生物信息学和流行病学系的研究人员使用MathWorks工具将基因组和代谢数据纳入系统模型,以测试假设。该大学还使用MathWorks工具来支持该系在基因组学、蛋白质组学和生物学方面的一些研究计划生物信息学,如系统生物学、代谢建模和多元统计。

“算法识别的驱动力根植于生物学,因此我们的生物学家必须开发快速原型应用程序,”MUSC生物信息学副教授乔纳斯·阿尔梅达博士说。“MATLAB提供了一个用户友好的环境,使我们能够快速、轻松地从理论过渡到应用。”

挑战

该系的研究团队寻求一个健壮的数学建模环境,用于解决常微分方程、图像处理、统计分析、优化和序列比对系统。

该环境需要与他们现有的网络技术、开源软件以及来自国家生物技术信息中心(NCBI)的数据进行集成。

由于生命科学家通常缺乏数学建模软件的经验,环境也需要易于学习和使用。

解决方案

在考虑了许多商业和开源的数学建模工具后,该小组选择了MATLAB®因为它易于使用、互操作性、行业接受度以及丰富的建模和计算能力。

小组内的研究团队使用MATLAB开发用于基因组和蛋白质组学分析的应用程序,如生物标志物鉴定、二维凝胶分析和人工神经网络。他们使用MATLAB web Server将这些包通过网络提供给其他团体和科学界。世界杯预选赛小组名单

MATLAB,统计和机器学习工具箱™和优化工具箱™为该小组的大部分工作提供了基础。“MATLAB是我们功能的核心。我们所做的一切都使用统计学和机器学习工具箱。我们还使用优化工具箱进行数值解耦,通过神经网络跟踪状态变量,并结合遗传算法,”Almeida说。

该小组使用生物信息学工具箱™简化序列比对使用Needleman-Wunsch和Smith-Waterman算法。该工具箱还使他们能够规范化、可视化和导入微阵列,包括来自NCBI基因表达Omnibus的数据。他们还使用MATLAB中的SOAP客户端与Internet上的本地和公共数据进行交互。

MUSC使用小波工具箱™和图像处理工具箱™去噪和识别二维凝胶样品中的蛋白质簇。

在生化系统理论领域,研究人员使用符号数学工具箱™来数值解耦和重铸非线性微分方程系统。

他们还使用MATLAB对其他开源技术进行系统调用,包括PostgreSQL数据库和统计包R,并解析结果。

阿尔梅达说:“生物信息学社区对开源工具有强烈的偏见,但我们真的相信MATLAB与开源工具相当世界杯预选赛小组名单,因为我们开发的代码具有开放的架构,因此任何人都可以看到源代码。”“我不记得有一篇论文因为我使用了MATLAB而没有被接受。”

MUSC的研究人员计划继续使用MathWorks工具开发基因组、转录组学和蛋白质组学分析的应用程序。

结果

  • 著名研究基金.MathWorks工具帮助该系赢得了资助,包括国家医学图书馆15项生物信息学培训资助中的一项,以及国家心肺和血液研究所蛋白质组学中心10项奖励中的一项。阿尔梅达说:“图像在获得资助方面发挥着重要作用。“凝胶的彩色图片显示了侧面的蛋白质组学斑点簇,产生了很大的影响。使用MathWorks工具,我们可以在几分钟内完成。”

  • 学生生产力高.阿尔梅达解释说:“生物学的学生可以用MATLAB很容易地学习动态编程。”“我们基本上有一个学期的时间来训练它们,用MATLAB就足够了。”

  • 更短的计算时间.利用MATLAB和微分方程解耦系统的技术,该小组加速了从代谢或蛋白质组学时间序列数据确定通路结构的过程。在一台使用MATLAB的机器上,他们在不到15分钟的时间内完成了这个过程。在几百个处理器的集群上使用大量并行化的方法需要几个小时才能产生结果。

南卡罗来纳医科大学是全球1300所提供MATLAB和Simulink校园访问的大学之一。有了校园范围的许可,研究人员、教师和学生可以访问最新版本的产品的公共配置,以便在任何地方使用——在教室、在家里、在实验室或在现场。2022世界杯八强谁会赢?

Baidu
map