用户故事

Rosetta预测乳腺癌患者的临床结果

挑战

准确预测乳腺癌患者的临床转归

解决方案

使用MathWorks产品开2022世界杯八强谁会赢?发一个工具,让临床医生根据患者原发肿瘤的基因表达谱做出预后

结果

  • 准确预测疾病转归
  • 快速、有效地响应科学家的需求
  • 随时调整算法的灵活性

MathWorks工具是我们执行的自定义分析工作的一部分。MATLAB使我们可以专注于数据分析而不是编程。它大大加快了我们的编码过程。”

戴鸿岳博士,罗塞塔制药/默克公司
乳腺癌样本DNA微阵列基因表达数据。表达模式与图顶部相似的患者通常预后较差。

Rosetta Inpharmatics是默克公司的全资子公司,最近与荷兰癌症研究所(NKI)合作开发了一种工具,使临床医生能够根据原发肿瘤的基因表达谱来判断乳腺癌患者的预后。这个项目是一个例子,说明当配备了正确的软件时,程序员可以迅速响应研究人员对定制分析工具的要求。

“MathWorks工具是这种类型的定制分析工作的组成部分,”Rosetta Inpharmatics/默克研究实验室定制分析和MATLAB工具总监Hongyue Dai博士说。“MATLAB让我们可以专注于数据分析,而不是编程。它大大加快了我们的编码过程,因为我们不必编写MATLAB库中已经存在的低级例程。”

挑战

对乳腺癌患者来说,很难确定最佳的治疗方案。处于同一疾病阶段并接受相同治疗的患者可能会有明显不同的结果。化疗和激素治疗可将远处转移的风险降低约三分之一,但研究表明,如果没有化疗和激素治疗,70-80%接受这种治疗的患者可以存活

戴博士和他的同事被要求开发一种工具,使癌症研究人员能够确定乳腺癌患者的哪些基因是未来转移的有力预测因子。要做到这一点,他们需要将强大的统计功能与快速处理大型数据集的能力相结合的软件。软件必须足够灵活,允许在选择特征和构造分类器时进行试错。

“微阵列实验的一个关键挑战是图像分析,”戴博士解释说。他的团队需要一种有效的方法,从微阵列幻灯片的TIFF图像中提取信号强度,以确定在特定细胞中存在多少基因。因为TIFF图像太大太复杂,无法手工处理,程序员需要对图像进行预处理,并设计一个批处理流程来提取相关数据。

*早期乳腺癌试验者合作小组

解决方案

NKI的研究人员与罗塞塔团队合作,在五年多的时间里跟踪了117名患者的进展。他们检测了预后不良患者的原始DNA样本,以确定与预后不良相关的基因表达水平。利用这些数据,戴博士的编程人员使用MATLAB进行DNA微阵列分析,识别出对远处转移有很强预测能力的基因。

“由于MATLAB和图像处理工具箱™是完全集成的,并且MATLAB平台非常适合矩阵计算,我们不必花时间编写低级图像处理和基本数据分析例程,如向量和矩阵计算,”戴博士指出。

然后,程序员在MATLAB中开发了一种无监督的分级聚类算法,使他们能够根据主要的表达特征对患者的肿瘤进行分组。然后,他们根据携带预后信息的基因开发了一个分类器。他们发现有70个基因与患者的预后密切相关,这表明可以根据原发肿瘤的基因表达谱来确定预后。

信息学小组还使用MATLAB为他们的商业产品罗塞塔解析器基因表达数据分析系统(Rosetta Resolver Gene Expression Data Analysis System)创建了算法原型和代码。基于与乳腺癌预测工具相同的前提,Rosetta Resolver包括用于高性能分析、可视化和存储基因表达数据的工具。戴博士指出,MATLAB大大加快了该产品的原型制作过程。

结果

  • 准确预测疾病转归.基因谱分析方法使科学家能够准确预测疾病的结果。与目前使用的临床方法相比,基于微阵列的分类器可以将乳腺肿瘤患者的不必要毒性化疗从90%减少到近40%。

  • 快速、有效地响应科学家的需求.戴博士说:“我们的研究人员对快速反馈感到满意。”“使用MathWorks工具,我们可以非常快速地响应他们的请求,科学家使用这些工具也很容易。使用我们在MATLAB中开发的gui,他们可以访问函数,而不必记住底层代码。”

  • 随时调整算法的灵活性.戴博士指出:“如果我们用C语言完成这项工作,我们将不得不编写一个函数,编译它,链接到某个库,并且每当我们做一点小小的更改时都要重复这个过程。”“在MATLAB中,我们可以使用命令行界面更容易地完成这项工作。”

2022世界杯八强谁会赢?产品使用

展示你的成功

加入客户参考计划

Baidu
map