生物信息学的工具箱

生物信息学的工具箱

阅读、分析和可视化基因组和蛋白质组数据

开始:

下一代测序分析

生物信息学工具箱为下一代测序分析提供算法和可视化技术。该工具箱使您能够在碱基对分辨率水平上执行计算的同时分析整个基因组。您可以使用NGS浏览器使用单端或成对端短读取来可视化和研究短读取对齐。您还可以构建自定义分析例程,如下面的示例所示。

存储和管理短读序列数据

用于下一代测序分析的数据集通常太大,无法装入物理内存。生物信息学工具箱提供了专门的数据容器,使您能够分析整个基因组。

BioIndexedFile对象允许您访问文本文件的内容,这些文本文件包含大小不一致的条目,如序列、注释和对数据集的交叉引用。您可以从表、平面文件或特定于应用程序的格式(如SAM、FASTA和FASTQ)生成这些对象。

BioMap类存储来自短读取序列的信息,包括序列头、读取序列、质量评分以及关于对齐和映射到单个引用序列的数据。您可以使用对象属性和方法来探索、访问、筛选和操作生物地图对象中包含的数据。

微阵列数据分析与可视化

使用应用程序和函数来获取、可视化、分析和处理多种数据类型的图像。

微阵列正常化

可以使用几种方法来规范化微阵列数据,包括低值、全局平均值、中位数绝对偏差(MAD)和分位数规范化。您可以将这些方法应用到整个微阵列芯片或特定的区域或块。过滤和imputation功能允许您在运行分析和可视化例程之前清理原始数据。

数据分析与可视化

生物信息学工具箱允许您从Affymetrix执行背景调整和计算基因(探针集)表达值®微阵列探针级数据使用鲁棒多阵列平均(RMA)和GC鲁棒多阵列平均(GCRMA)程序。你可以对阵列CGH数据应用圆形二进位分割,并估计来自微阵列实验的基因表达数据的多个假设测试的错误发现率。您还可以对多个Affymetrix CEL文件的探针强度或来自两个不同实验条件的基因表达值执行秩不变集归一化。

可视化微阵列数据的专门例程包括火山图、箱形图、对数图、I-R图和微阵列的空间热图。您还可以用g带模式可视化表意文字。

使用例程从统计和机器学习工具箱™,您可以对结果进行分类,执行分层和k均值聚类,并在统计可视化中表示微阵列数据,例如具有最佳叶顺序的2D聚类图、热图、主成分图和分类树。

#

微阵列数据的火山图显示显著性与基因表达比。

质谱数据分析

生物信息学工具箱为质谱数据分析提供了一套功能。这些功能可以对SELDI、MALDI、LC/MS和GC/MS数据进行预处理、分类和标记识别。预处理功能包括基线校正、平滑、校准和重采样。您可以使用M/Z轴校准原始光谱数据,并对LC/MS和GC/MS数据进行保留时间校准。你可以同时绘制多个光谱。

您可以平滑、对齐和规范化光谱,然后使用分类和统计学习工具创建分类器并识别潜在的生物标志物

#

使用生物信息学工具箱进行无标签差异蛋白质组学和代谢组学分析。

图论,统计学习和基因本体论

图论与可视化

生物信息学工具箱使您能够将基本图论应用到稀疏矩阵。您可以创建、查看和操作图,例如交互映射、层次结构图和路径。您可以确定和查看图中的最短路径,测试有向图中的循环,并查找两个图之间的同构。

统计学习与可视化

生物信息学工具箱提供了基于分类和统计学习算法的功能统计和机器学习工具箱,包括:

  • 支持向量机(SVM)和k近邻分类器
  • 设置交叉验证实验和测量不同分类方法的性能的功能
  • 用于特征选择、映射和显示层次图和路径的交互式工具
统计学习和可视化。

统计学习和可视化。

基因本体论

生物信息学工具箱使您能够从MATLAB中访问基因本体数据库®,解析基因本体注释文件,得到本体的子集,如祖先、后代或亲属。

序列分析

生物信息学工具箱为基因组和蛋白质组序列数据提供序列分析和可视化工具。您可以执行各种各样的分析,包括多重序列比对和构建、交互式查看和操作系统发育树。

序列比对

该工具箱提供了用于序列分析的函数、对象和方法,包括成对序列、序列概要和多重序列比对。这些包括:

  • 局部和全局序列对齐标准算法的MATLAB实现,如Needleman-Wunsch, Smith-Waterman和轮廓隐马尔可夫模型算法
  • 渐进式多序列比对
  • 对齐结果矩阵的图形表示
  • 标准评分矩阵,如PAM和BLOSUM矩阵族
  • 一致性序列计算和序列标识显示

探索图库(3张图片)

序列实用程序和统计

该工具箱允许您操作和分析序列,以更深入地理解数据。您可以:

  • 利用遗传密码将DNA或RNA序列转换为氨基酸序列
  • 对序列进行统计分析,并在序列中搜索特定的模式
  • 应用限制性内切酶和蛋白酶执行硅内消化序列或为测试用例创建随机序列
  • 预测RNA序列的最小自由能二级结构

序列可视化

工具箱使您能够可视化序列和对齐。您可以查看带有GenBank功能注释的序列的线性或圆形映射。你可以看到RNA序列的二级结构图。交互式查看器允许您探索和修改成对和多个序列对齐。

系统发育树分析

该工具箱使您能够创建和编辑系统发育树。您可以使用广泛的相似度量(如Jukes-Cantor、p-distance、校准评分或用户定义的距离方法)来计算对齐或未对齐的核苷酸或氨基酸序列之间的成对距离。系统发生树的构建采用了多种层次连接技术,包括邻居连接、单一和完全连接以及非加权对组平均方法(UPGMA)。

该工具箱支持对树进行加权和重根,计算子树,以及计算树的标准形式。系统发生树查看器允许您修剪、重新排序和重命名分支;探索距离;以及读写newick格式的文件。您还可以使用MATLAB中的注释工具来创建演示质量的树。

蛋白质功能分析

工具箱提供了蛋白质序列分析技术,包括计算肽序列属性的例程,如原子组成、等电点和分子量。您可以确定蛋白质序列的氨基酸组成,用酶切割蛋白质,并创建PDB数据的主干图和拉马钱德兰图。您可以使用序列工具查看氨基酸序列的属性,或使用分子查看器显示和操作3D分子结构。

数据导入和应用部署

文件格式和数据库访问

您可以访问生物数据的标准文件格式、在线数据库和Web站点。生物信息学工具箱使您能够:

  • 从标准文件格式(包括FASTA、PDB和SCF)读取序列数据
  • 从文件格式中读取微阵列数据,如Affymetrix DAT, EXP, CEL, CHP和CDF文件;ImaGene®结果格式数据;安捷伦科技公司®特征提取软件文件;和GenePix®GPR和GAL文件
  • 从在线数据库(如GenBank、EMBL、NCBI BLAST和PDB)中读取数据
  • 用一个命令直接从NCBI基因表达综合网站导入数据
  • 阅读NCBI表意文字或UCSC细胞带文本文件中的细胞遗传学带信息
  • 从MZXML和JCAMP-DX文件中读取质谱数据

共享算法和部署应用

MATLAB提供了一些工具,可以让您将数据分析程序转换为定制的软件应用程序。这些工具包括用于构建用户界面的开发工具、可视化集成开发环境和分析器。MATLAB应用程序部署产品允许您将MATLAB算法与现有的2022世界杯八强谁会赢?C、c++和Java™应用程序集成,将开发的算法和自定义接口部署为独立的应用程序,将MATLAB算法转换为Microsoft®.NET或COM组件,可以从任何基于COM的应用程序访问,并创建Microsoft Excel®插件。

您可以将MATLAB与常用的生物信息学工具集成,例如BioPerl、基于soap的Web服务和COM插件。

共享算法和部署应用程序。

共享算法和部署应用程序。

Baidu
map