고객 사례

疾病控制和预防中心——폴리오바이러스의염기서열분석및추적자동화사례

과제

폴리오바이러스의전염과진화를추적하여全球消灭脊灰行动지원

솔루션

MathWorks툴을사용하여유전자염기서열분석수행,계통수생성,면역프로그램추진에유용한보고서와지도제작

결과

  • 수작업워크플로의자동화및가속화
  • 군집분석시간수개월단축
  • 독립형염기서열분석툴개발

CDC는MATLAB、生物信息学工具箱및MATLAB编译器를통해단일환경내에서여러수작업단계를간소화할수있었습니다。3일이전에이걸리던과정을이제는몇시간만에완료할수있으므로연구실은소아마비면역프로그램에정말중요한연구에집중할수있습니다。

폴리오바이러스입자。

본사례가있다는사실이CDC또는미국정부가이MathWorks소프트웨어툴을비슷한다른소프트웨어보다더추천하거나MathWorks조직또는기타MathWorks제품을추천한다고주장,추론또는암시하는것은아닙니다。

폴리오바이러스는전세계대부분의지역에서박멸되었지만아프가니스탄,인도,나이지리아,파키스탄을포함한몇몇국가에서여전히발생하고있습니다。CDC(疾病控制和预防中心)는소아마비풍토국가와파트너기관에역학적및기술적전문지식을제공함으로써谁(세계보건기구)의根除脊髓灰质炎行动를지원합니다。

CDC의PMEL(脊髓灰质炎病毒分子流行病学实验室)에서는폴리오바이러스샘플의염기서열분석을통해유전적형질을파악하고바이러스의변화와확산을모니터링합니다。이연구실은연구원들이바이러스가복제중에어떻게진화하는지이해하고보건기관이더효과적인면역캠페인을시작하도록도울수있는포괄적인보고서를작성합니다。

MATLAB®및관련툴박스는cdc의바이러스추적및보고과정을가속화할수있습니다。CDC는MathWorks툴을통해유전자염기서열분석데이터의관리및분석에서노동집약적워크플로의여러단계를자동화할수있었습니다。그결과CDC직원은일상적인특성분석및보고작업에더적은시간을소비하고응용연구에더많은시간을투자할수있습니다。

과제

CDC연구실은환자데이터를처리하고서아프리카의연구실에서획득한유전자샘플의염기서열을분석합니다。소아마비연구결과는상세한월별보고서로작성되어who에전달됩니다。이보고서에는지난3년간한지역에서어떤바이러스들이유행했는지,그리고이러한바이러스가서로어떤관련이있는지를보여주는계통수(덴드로그램)가포함됩니다。

과거에는이보고서를작성하고폴리오바이러스발병을지리적으로플로팅하는작업은微软®访问데이터베이스와Unix®기반프로그램및스크립트등여러플랫폼과기술을넘나드는노동집약적과정이었습니다。

3000개염기서열의데이터를모두조합한후바이러스의레이블을지정하고색으로구분하고유전적계통의군집으로분리하는작업은최대3일이나걸리는일이었습니다。이과정은매우복잡했고,다른사람이작업을수행할수있도록교차교육하기도학습곡선이급격했습니다。

CDC는연구실내다른사람들이사용할수있는툴로이워크플로를자동화하고보고서를배포와파악이간편한형식으로작성해야했습니다。

솔루션

MATLAB、生物信息学的工具箱및기타툴박스는CDC에게폴리오바이러스추적및보고과정을간소화하는툴을구축할플랫폼을제공했습니다。

연구원들은환자데이터를개별유형과연결하기위해数据库工具箱를사용하여각유전자샘플의날짜와위치가포함된환자정보를MATLAB으로읽어들인후生物信息工具箱를사용하여가져온FASTA형식파일의염기서열분석정보에이환자정보를연결합니다。

CDC연구원들은유전데이터를분석하고유전적으로유사한바이러스의군집을식별하기위해生物信息工具箱와统计和机器学习工具를사용하여유전자염기서열을정렬하고이웃결합계통수를생성합니다。연구팀은바이러스를항원형과유전자형에따라분류한후관련된바이러스의군집으로분리하는MATLAB기반군집분석툴을MathWorks컨설턴트와협력하여개발했습니다。

팀원들은映射工具箱를사용하여이군집을지역지도상에색으로구분된점으로플로팅합니다。보건기관은군집분포지도를통해폴리오바이러스발생지역을확인하고바이러스이동패턴을식별할수있습니다。

전체워크플로의간소화를위해CDC PMEL은MATLAB编译器를사용하여독립형프로그램을구축했습니다。이러한프로그램에는손쉽게데이터베이스와파일을선택하고덴드로그램에환자정보주석을달고월별보고서를작성할수있도록돕는인터페이스가들어있습니다。주석이달린계통수의더폭넓은문서는MATLAB报告生成器를사용하여생성됩니다。

CDC연구원들은한관련프로젝트에서폴리오바이러스가어떻게변이하고진화하는지를연구하고있습니다。예를들어이들은MATLAB및生物信息工具箱를사용하여100년에걸친폴리오바이러스게놈의돌연변이를시뮬레이션합니다。이연구결과는면역프로그램이바이러스의진화에어떤영향을미칠수있는지를보건조직이파악하는데도움이될것으로보입니다。

CDC PMEL은파키스탄,인도,남아프리카의다양한전문국제소아마비연구실에서CDC가개발MATLAB기한반염기서열분석툴을도입하도록돕고있습니다。

결과

  • 수작업워크플로의자동화및가속화.이전에는월별소아마비보고서작성에3일이나걸리곤했습니다。CDC가MATLAB、生物信息学工具箱및MATLAB编译器로구축한툴을사용하면최소한의교육만받은기술자도대략한시간안에보고서를작성할수있습니다。

  • 군집분석시간수개월단축.과거에CDC연구원들은수작업으로군집을지정했는데,커다란포스터에손으로쓰면서스프레드시트에서유전적차이데이터를가져오는방식이었습니다。이러한작업은3개월간의상당한노력을。지금은MATLAB기반군집분석툴을사용함에따라모든데이터를한곳에서찾을수있습니다。이과정은문서화가잘되어있어CDC연구원들은집중해서작업한다면일주일만에도완료할수있습니다。

  • 독립형염기서열분석툴개발.CDC소아마비그룹이MATLAB编译器를사용하여배포한염기서열분석툴은지역내에서연구결과의적시성과전파효율성을크게개선할것으로기대됩니다。MATLAB이설치되지않은연구실의바이러스학자들은이툴을사용하여지도를직접제작하고계통수에레이블을지정하고바이러스발병지점을정확히파악할수있습니다。

Baidu
map