用户故事

Rosetta预测乳腺癌患者的临床结果

挑战

准确预测乳腺癌患者的临床结果

解决方案

使用MathWorks产品开2022世界杯八强谁会赢?发一种工具,让临床医生根据患者原发肿瘤的基因表达谱做出预后判断

结果

  • 准确预测疾病结局
  • 快速、有效地响应科学家的需求
  • 在必要时灵活调整算法

“MathWorks工具对于我们执行的定制分析工作是不可或缺的。MATLAB使我们可以专注于数据分析,而不是编程。它大大加快了我们的编码过程。”

Dr. Hongyue Dai, Rosetta Inpharmatics/Merck & Company
乳腺癌样本DNA微阵列基因表达数据。与图顶部表达模式相似的患者通常预后较差。

默克公司(Merck & Company)的全资子公司Rosetta Inpharmatics最近与荷兰癌症研究所(NKI)合作开发了一种工具,使临床医生能够根据原发肿瘤的基因表达谱确定乳腺癌患者的预后。这个项目是一个例子,说明当配备了正确的软件时,程序员可以迅速响应研究人员对定制分析工具的请求。

“MathWorks工具是这种类型的定制分析工作不可或缺的,”Rosetta Inpharmatics/Merck研究实验室的定制分析和MATLAB工具总监Dai Hongyue博士说。“MATLAB使我们可以专注于数据分析,而不是编程。它大大加快了我们的编码过程,因为我们不需要编写MATLAB库中已经存在的低级例程。”

挑战

为乳腺癌患者确定最佳的治疗方案是很困难的。处于相同疾病阶段和接受相同治疗的患者可能会有明显不同的结果。化疗和激素治疗可将远处转移的风险降低约三分之一,但研究表明,70-80%接受这种治疗的患者如果没有它也能存活

戴博士和他的同事被要求开发一种工具,使癌症研究人员能够确定乳腺癌患者的哪些基因是未来转移的有力预测因子。要做到这一点,他们将需要软件,将强大的统计功能与快速处理大型数据集的能力相结合。软件必须足够灵活,允许在选择特征和构建分类器时进行试错。

“微阵列实验的关键挑战之一是图像分析,”戴博士解释说。他的团队需要一种有效的方法,从微阵列幻灯片的TIFF图像中提取信号强度,以确定特定细胞中存在多少基因。由于TIFF图像太大太复杂,无法手工处理,程序员需要对图像进行预处理,并设计一个批处理过程来提取相关数据。

*早期乳腺癌试验者合作小组

解决方案

NKI研究人员与罗塞塔团队合作,对117名患者的进展进行了五年多的跟踪研究。他们检查了结果不佳的患者的原始DNA样本,以确定其表达水平与结果相关的基因。利用这些数据,戴博士的编程人员使用MATLAB进行DNA微阵列分析,识别出了能够有力预测远处转移的基因。

“由于MATLAB和图像处理工具箱™是完全集成的,MATLAB平台非常适合矩阵计算,我们不必花时间编写低级图像处理和基本的数据分析例程,如向量和矩阵计算,”戴博士指出。

然后,编程人员在MATLAB中开发了一种无监督的分层聚类算法,使他们能够根据主要表达特征对患者的肿瘤进行分组。然后,他们根据携带预后信息的基因开发了一种分类器。他们发现有70个基因与患者的预后密切相关,这表明可以根据原发肿瘤的基因表达谱来确定预后。

信息学小组还使用MATLAB为他们的商业产品Rosetta Resolver基因表达数据分析系统创建了算法原型和代码。基于与乳腺癌预测工具相同的前提,Rosetta Resolver包括用于高效分析、可视化和基因表达数据存储的工具。戴博士指出,MATLAB大大加快了该产品的原型制作过程。

结果

  • 准确预测疾病结局.基因分析方法使科学家能够准确预测疾病的结果。与目前临床使用的方法相比,基于微阵列的分类器可将不必要的毒性化疗从90%的乳腺肿瘤患者减少到近40%。

  • 快速、有效地响应科学家的需求.戴博士说:“我们的研究科学家对快速反馈很满意。”“使用MathWorks工具,我们可以非常快速地响应他们的请求,科学家们也很容易使用这些工具。使用我们在MATLAB中开发的gui,他们可以访问函数,而不必记住底层代码。”

  • 在必要时灵活调整算法.戴博士指出:“如果我们用C语言完成这项工作,我们将不得不编写一个函数,编译它,链接到某个库,每次我们做一点改变都要重复这一过程。”“在MATLAB中,我们可以使用命令行界面更容易地完成这项工作。”

2022世界杯八强谁会赢?产品使用

Baidu
map