用户故事

疾病控制和预防中心自动化脊髓灰质炎病毒测序和跟踪

挑战

通过跟踪脊髓灰质炎病毒的传播和演变,支持全球根除脊髓灰质炎行动

解决方案

使用MathWorks工具执行基因测序,生成系统发育树,并生成用于帮助指导免疫规划的报告和地图

结果

  • 手动工作流程自动化和加速
  • 聚类分析时间缩短了几个月
  • 独立测序工具开发

MATLAB、生物信息学工具箱和MATLAB编译器使CDC能够在单一环境中简化许多手动步骤。过去需要三天的过程现在可以在几个小时内完成,这使得实验室可以专注于对脊髓灰质炎免疫规划非常重要的研究。

脊髓灰质炎病毒粒子。

本报道的存在并不声称、推断或暗示CDC或美国政府支持此MathWorks软件工具,即支持此MathWorks软件工具超过任何其他类似软件、MathWorks组织或任何其他MathWorks产品。

脊髓灰质炎病毒在世界大部分地区已被消灭,但在包括阿富汗、印度、尼日利亚和巴基斯坦在内的几个国家仍很活跃。疾病控制和预防中心(CDC)通过向脊髓灰质炎流行国家和伙伴机构提供流行病学和技术专门知识,支持世界卫生组织(世卫组织)的根除脊髓灰质炎行动。

疾控中心的脊髓灰质炎分子流行病学实验室(PMEL)对脊髓灰质炎病毒样本进行测序,以确定其遗传特征,并在病毒发生变化和传播时监测病毒。该实验室提供了全面的报告,使研究人员能够了解病毒在复制过程中是如何演变的,并帮助卫生机构开展更有效的免疫运动。

MATLAB®以及相关工具箱加速了CDC的病毒跟踪和报告过程。MathWorks工具使CDC能够将过去管理和分析基因测序数据的劳动密集型工作流程中的许多步骤自动化。因此,疾控中心工作人员花在常规描述和报告任务上的时间更少,而花在应用研究上的时间更多。

挑战

疾控中心的实验室处理来自西非实验室的患者数据和基因样本序列。脊髓灰质炎的研究结果汇编在世界卫生组织每月的详细报告中。报告中包括一个系统发育树(树状图),它显示了过去三年在该地区传播的病毒以及它们之间的关系。

过去,编写这份报告和绘制脊髓灰质炎病毒疫情的地理分布图是一个劳动密集型过程,跨越多个平台和技术,包括微软®访问数据库和UNIX®基于程序和脚本。

组装3000个序列的所有数据,然后进行标记、颜色编码,并将病毒分成遗传谱系簇,这需要三天的时间。这个过程非常复杂,交叉训练其他人来完成这项任务需要陡峭的学习曲线。

CDC需要用实验室中的其他人可以使用的工具来自动化这个工作流程,并以一种易于分发和理解的格式生成报告。

解决方案

MATLAB、生物信息学的工具箱和其他工具箱为疾病控制与预防中心提供了一个平台,以建立简化脊髓灰质炎病毒跟踪和报告过程的工具。

为了将患者数据与单个菌株联系起来,研究人员使用了数据库工具箱将患者信息,包括每个基因样本的日期和位置,读取到MATLAB中,并将其链接到使用生物信息学工具箱导入的fasta格式文件中的测序信息。

为了分析遗传数据并识别基因相似的病毒簇,CDC的研究人员使用生物信息学工具箱、统计和机器学习工具箱校准遗传序列并生成邻座系统发育树.该团队与MathWorks顾问合作,开发了一个基于MATLAB的聚类分析工具,该工具根据血清型和基因型对病毒进行分类,然后将它们分离为相关病毒的集群。

该团队使用“地图工具箱”(Mapping Toolbox)在区域地图上用颜色编码的点绘制这些集群.群集分布图使卫生机构能够看到脊髓灰质炎病毒活跃的地方,并发现病毒的移动模式。

为了简化整个工作流程,CDC PMEL使用MATLAB编译器构建了独立的程序.这些程序具有一个界面,可以方便地选择数据库和文件,用患者信息注释树状图,并生成每月报告。使用MATLAB报告生成器生成了注释系统发生树的更广泛的文档

在一个相关的项目中,疾控中心的研究人员正在研究脊髓灰质炎病毒是如何变异和进化的。例如,他们使用MATLAB和生物信息学工具箱来模拟脊髓灰质炎病毒基因组在100年期间的突变。这项研究的结果将有助于卫生组织了解免疫计划如何影响病毒进化。

疾控中心PMEL正在帮助巴基斯坦、印度和南非的国际脊髓灰质炎研究实验室采用疾控中心开发的基于MATLAB的测序和分析工具。

结果

  • 手动工作流程自动化和加速.制作月度脊髓灰质炎报告过去需要三天时间。使用CDC用MATLAB、生物信息学工具箱和MATLAB编译器构建的工具,任何受过最低程度培训的技术人员都可以在大约一个小时内生成报告。

  • 聚类分析时间缩短了几个月.过去,疾病控制与预防中心的研究人员通过手写、在大海报上书写和整合电子表格中的遗传差异数据来指定群体。这是一项耗时三个月的巨大努力。利用基于MATLAB的聚类分析工具,所有的数据都在一个地方。这个过程有很好的记录,疾病控制与预防中心的研究人员可以在一个星期内集中精力完成。

  • 独立测序工具开发.CDC脊髓灰质炎小组使用MATLAB编译器部署的测序工具将显著提高一个区域内结果的及时性和通信。没有安装MATLAB的研究实验室的病毒学家可以使用这些工具进行自己的绘图,标记他们的系统发育树,并确定病毒出现的位置。

Baidu
map