生物信息学的工具箱

生物信息学的工具箱

유전체및단백체데이터를읽고분석하며시각화합니다。

시작하기:

차세대염기서열분석

生物信息工具箱는차세대염기서열분석을위한알고리즘과시각화기법을제공합니다。이툴박스를이용하면염기쌍수준의해상도로계산을수행하면서유전체전체를분석할수있습니다。门店브라우저를이용하면단일말단또는쌍말단단편서열을이용하여단편서열정렬을시각화하고조사할수있습니다。다음예제에나타나있듯이사용자지정분석루틴을구축할수도있습니다。

단편서열데이터의저장및관리

차세대염기서열분석에사용된데이터세트는너무커서물리적메모리에담을수없는경우가많습니다。生物信息工具箱는유전체전체를분석할수있는특수한데이터컨테이너를제공합니다。

BioIndexedFile객체를이용하면염기서열,주석,데이터세트에대한상호참조등불균일한크기의항목들을포함하는텍스트파일의내용에접근할수있습니다。테이블,플랫파일또는山姆,FASTA, FASTQ등의응용프로그램특정형식에서이런객체를생성할수있습니다。

BioMap클래스는염기서열헤더,서열염기서열,품질점,수정렬에관한데이터,단일참조염기서열에대한매핑등단편서열에서나온정보를저장합니다。객체속성과메서드를이용하여BioMap객체에담긴데이터를탐색,접근,선별,편집할수있습니다。

미세배열데이터의분석및시각화

앱및함수를사용하여다양한데이터형식으로된이미지를획득,시각화,분석및처리할수있습니다。

미세배열정규화

洛斯,전역평균,중앙값절대편차(疯狂),분위수정규화등다양한방법을이용하여미세배열데이터를정규화할수있습니다。이러한방법을미세배열칩전체또는특정한역또는블록에적용할수있습니다。필터링함수와대체함수를이용하면분석및시각화루틴을실행하기전에원시데이터를정리할수있습니다。

데이터분석및시각화

生物信息学工具箱를이용하면배경조정을수행하고,RMA(鲁棒多阵列平均)와GCRMA(GC鲁棒多阵列平均)절차를이용하여Affymetrix®미세배열프로브수준데이터로부터유전자(프로브세트)발현값을계산할수있습니다。원형이진분할(循环二进制分割)을적용하여CGH데이터를정렬하고,미세배열실험에서나온유전자발현데이터에대한여러가설검정의오발견률을추정할수있습니다。여러Affymetrix玻璃纸파일에대한프로브강도에대해,또는두가지다른실험조건에서나온유전자발현값에대해순위불변세트정규화를수행할수도있습니다。

미세배열데이터를시각화하는데사용되는특수한루틴에는볼케이노플롯,상자플롯,로그로그플롯,ir플롯,미세배열의공간히트맵등이있습니다。G-분염패턴으로이디오그램을시각화할수도있습니다。

统计和机器学习工具箱™의루틴을이용하여결과를분류하고계층적군집화및K -평균군집화를수행하며,미세배열데이터를최적리프순서를갖는2차원클러스터그램,히트맵,주성분플롯,분류트리등의통계적시각화를통해표현할수있습니다。

#

유의도대비유전자발현비율을시하는미세배열데이터의볼케이노플롯

질량분석데이터분석

生物信息工具箱는질량분석데이터분석에활용할수있는함수들을제공합니다。이러한함수들을통해SELDI, MALDI, LC / MS、GC / MS데이터에대해전처리및분류하고생물지표를식별할수있습니다。전처리함수에는기준선조정,평활화,보정,재추출등이있습니다。M / Z축을이용하여원시스펙트럼데이터를정렬하고LC / MS、GC / MS데이터에대해체류시간정렬을수행할수있습니다。여러개의스펙트럼을동시에그릴수있습니다。

스펙트럼을평활,화정렬,정규화하고,이어서분류및통계학습도구를이용하여분류기를만들고잠재적인생물지표를식별할수있습니다。

#

生物信息学工具箱를이용한레이블없는단백체및대사체분석

그래프이론,통계학습및유전자온톨로지

그래프이론및시각화

生物信息工具箱를이용하면기본그래프이론을희소행렬에적용할수있습니다。상호작용지도,계층구조플롯,경로등그래프를생성,관찰,편집할수있습니다。그래프에서최단경로를파악및관찰하고,유방향그래프에서순환이있는지시험하고,두그래프사이의동형사상관계를발견할수있습니다。

통계학습및시각화

生物信息学工具箱는다음과같은统计和机器学习工具箱의분류및통계학습알고리즘을이용합니다。

  • 서포트벡터머신(SVM)및k-최근접이웃분류기
  • 교차검실험을설정하고다양한분류방법의성능을측정하는함수
  • 특징선택,매핑,계층구조플롯및경로@시를위한대화형도구
통계학습과시각화

통계학습및시각화

유전자온톨로지

生物信息学工具箱를이용하면MATLAB®에서유전자온톨로지데이터베이스에액세스하고,유전자온톨로지주석파일을구문분석하며선조,후손또는친족등온톨로지의부분집합을얻을수있습니다。

염기서열분석

生物信息工具箱는유전체및단백체염기서열데이터에대한염기서열분석과시각화도구를제공합니다。다양한염기서열을정렬하고,계통수를구축하고대화형방식으로보고,편집하는등다양한방식으로분석할수있습니다。

염기서열정렬

이툴박스는쌍단위염기서열,염기서열프로파일,다중서열정렬등염기서열분석을위한함수,객체,메서드를제공합니다。여기에는다음이포함됩니다。

  • ,均为Needleman-Wunsch프로파일은닉마르코프모델알고리즘등국소및전역염기서열정렬을위한MATLAB표준알고리즘구현
  • 점진적다중서열정렬
  • 정렬결과행렬의시각적현
  • Pam, blosum행렬군등의준측정행렬
  • 공통서열계산및서열로고시

갤러리탐색(이미지3개)

염기서열유틸리티와통계학

生物信息工具箱를이용하면염기서열을편집하고분석하여데이터를더욱깊이있게이해할수있습니다。다음을수행할수있습니다。

  • 유전암호를이용하여dna나RNA염기서열을아미노산서열로변환
  • 염기서열에대한통계분석수행및염기서열내특정패턴검색
  • 제한효소와단백질분해효소를적용하여염기서열에대한인실리코소화수행또는시험사례를위한임의의염기서열생성
  • RNA염기서열의최소자유에너지2차구조예측

염기서열시각화

生物信息工具箱를이용하여염기서열과정렬을시각화할수있습니다。GenBank특징이주석으로달린선형또는원형염기서열지도를볼수있습니다。RNA염기서열의2차구조를시각화할수있습니다。대화형뷰어를이용하여쌍단위및다중서열정렬을탐색하고수정할수있습니다。

계통수분석

生物信息工具箱를이용하여계통수를만들고편집할수있습니다。Jukes-Cantor p거리,정렬점수또는사용자정의거리법등의다양한유사성행렬을이용하여,정렬되거나정렬되지않은뉴클레오타이드또는아미노산염기서열사이의쌍단위거리를계산할수있습니다。근린결합,단일연결및완전연결,비가중쌍별평균결합법(UPGMA)등다양한기법의계층구조연결을이용하여계통수를구축합니다。

이툴박스를이용하여계통수에가중치를부여하고,뿌리를재결정하고,서브트리를계산하고,계통수의표준형식을계산할수있습니다。계통수뷰어를이용하면가지치기,순서변경및이름변경이가능합니다。또한거리를탐색하고纽维克형식파일을읽거나쓸수있습니다。MATLAB의주석도구를이용하여발표에사용할수있는수준의계통수를만들수도있습니다。

단백질특징분석

生物信息工具箱는원자조성,등전점,분자질량등펩타이드염기서열의속성을계산하는루틴등단백질염기서열분석기법을제공합니다。단백질염기서열의아미노산조성을파악하고,효소로단백질을쪼개고,PDB데이터에대한뼈대플롯및라마찬드란플롯을만들수있습니다。序列的工具을이용하면아미노산염기서열의물성을관찰할수있고分子观众를이용하여3차원분자구조를표시하고편집할수있습니다。

데이터가져오기및응용프로그램배포

파일형식및데이터베이스액세스

생물학데이터의표준파일형식,온라인데이터베이스,웹사이트등에액세스할수있습니다。生物信息学工具箱으로다음과같은작업이가능합니다。

  • Fasta, pdb, SCF등,준파일형식에서염기서열데이터읽기
  • Affymetrix DAT, EXP, CEL, CHP, CDF파일,ImaGene®결과형식데이터,安捷伦®特征提取软件파일,GenePix®GPR및gal파일등의파일형식에서미세배열데이터읽기
  • 基因库,EMBL NCBI BLAST, PDB등의온라인데이터베이스에서데이터읽기
  • 단일명령으로NCBI基因表达综合웹사이트에서직접데이터가져오기
  • Ncbi이디오그램또는ucsc사이토밴드텍스트파일에서세포유전학분염정보읽기
  • MZXML및jcamp-dx파일에서질량분석데이터읽기

알고리즘공유및응용프로그램배포

MATLAB은사용자의데이터분석프로그램을사용자지정소프트웨어응용프로그램으로변환할수있는도구를제공합니다。이러한도구에는사용자인터페이스,비주얼통합개발환경,프로파일러구축을위한개발도구등이있습니다。MATLAB응용프로그램배포제품을이용하면사용자의MATLAB알고리즘을기존의C, c++, Java™응용프로그램과통합하고,개발된알고리즘과사용자지정인터페이스를독립된응용프로그램으로서배포하며,MATLAB알고리즘을모든COM기반응용프로그램에서액세스할수있는微软®.NET또는COM구성微软Excel®애드,을생성할수있습니다。

MATLAB을BioPerl, SOAP기반웹서비스,COM플러그인등널리사용되는생물정보학도구와통합할수있습니다。

알고리즘공유및응용프로그램배포

알고리즘공유및응용프로그램배포

Baidu
map