mspalign
从LC/MS或GC/MS数据集的多个峰值列表中对齐质谱
语法
[
CMZ
,AlignedPeaks
) = mspalign (Peaklist
)
[CMZ
,AlignedPeaks
) = mspalign (Peaklist
,“分位数”,QuantileValue
,……)
[CMZ
,AlignedPeaks
) = mspalign (Peaklist
……“EstimationMethod”,EstimationMethodValue
,……)
[CMZ
,AlignedPeaks
) = mspalign (Peaklist
……“CorrectionMethod”,CorrectionMethodValue
,……)
[CMZ
,AlignedPeaks
) = mspalign (Peaklist
……“ShowEstimation”,ShowEstimationValue
,……)
输入参数
Peaklist |
来自液相色谱/质谱(LC/MS)或气相色谱/质谱(GC/MS)数据集的峰列表细胞阵列。细胞阵列中的每个元素都是一个两列矩阵,第一列为m/z值,第二列为离子强度值。每个元素对应一个光谱或保留时间。 请注意 您可以使用 |
QuantileValue |
值,该值确定由估计方法选择要创建的峰值CMZ 为m/z值的向量。选择是任意值≥0 而且≤1 .默认是0.95 . |
EstimationMethodValue |
指定估计方法的字符向量或字符串CMZ ,为常见质量/电荷(m/z)值的向量。的选择是:
|
CorrectionMethodValue |
字符向量或字符串,指定将每个峰值列表对齐到CMZ 向量。的选择是:
|
ShowEstimationValue |
控制相对于估计方法和通用质量/电荷(m/z)值的向量的评估图的显示。的选择是真正的 或假 .默认是:
|
输出参数
CMZ |
常用的质量/电荷(m/z)值的向量mspalign 函数。 |
AlignedPeaks |
单元格阵列的峰值列表,具有相同的形式Peaklist ,但每个矩阵第一列的m/z值都经过了修正。 |
描述
[
通过首次估计,从多个峰表(中心化数据)对齐质谱CMZ
,AlignedPeaks
) = mspalign (Peaklist
)CMZ
的所有谱峰估计的共同质量/电荷(m/z)值的向量Peaklist
,一个峰列表的单元数组,其中每个元素对应一个频谱或保留时间。然后将每个谱中的峰值与中的值对齐CMZ
,创造AlignedPeaks
,对齐峰值列表的单元格数组。
[
调用CMZ
,AlignedPeaks
) = mspalign (Peaklist
,……”PropertyName
',PropertyValue
,……)mspalign
使用属性名/属性值对的可选属性。可以以任意顺序指定一个或多个属性。每一个PropertyName
必须用单引号括起来,不区分大小写。这些属性名/属性值对如下:
[
确定由估计方法选择要创建的峰值CMZ
,AlignedPeaks
) = mspalign (Peaklist
,“分位数”,QuantileValue
,……)CMZ
为m/z值的向量。选择是一个标量0
而且1
.默认是0.95
.
[
指定用于估计的方法CMZ
,AlignedPeaks
) = mspalign (Peaklist
……“EstimationMethod”,EstimationMethodValue
,……)CMZ
,为常见质量/电荷(m/z)值的向量。的选择是:
柱状图
——默认的方法。使用核密度估计方法对峰值位置进行聚类。峰值离子强度被用作权重因子。所有簇的中心都符合CMZ
向量。回归
-取观察到的显著峰间距离的样本,并对峰间距离进行回归,以创建CMZ
具有相似元素间距离的向量。
[
指定用于将每个峰值列表与CMZ
,AlignedPeaks
) = mspalign (Peaklist
……“CorrectionMethod”,CorrectionMethodValue
,……)CMZ
向量。的选择是:
加权
——默认的方法。对于每一个共同的高峰CMZ
向量,它在每个峰值表中的对应值是最接近公共峰值的m/z值的峰值。最短路径
-对于每个共同的高峰CMZ
向量,它在每个峰值列表中的对应点使用最短路径算法选择。
[
控制相对于估计方法和通用质量/电荷(m/z)值的估计向量的评估图的显示。的选择是CMZ
,AlignedPeaks
) = mspalign (Peaklist
……“ShowEstimation”,ShowEstimationValue
,……)真正的
或假
.默认是:
假
—当指定返回值时。真正的
—当没有指定返回值时。
例子
加载一个mat文件,包括生物信息学工具箱™软件,其中包含液相色谱/质谱(LC/MS)数据变量,包括
山峰
而且ret_time
.山峰
是峰值列表的单元数组,其中每个元素是m/z值和离子强度值的两列矩阵,每个元素对应于光谱或保留时间。ret_time
是与LC/MS数据集相关的留存时间的列向量。负载lcmsdata
重新采样未对齐的数据,在热图中显示它,然后覆盖一个点图。
(MZ, Y) = msppresample (ms_peaks, 5000);msheatmap (MZ, ret_time日志(Y))
msdotplot (ms_peaks ret_time)
点击放大按钮,然后单击点图两到三次,放大并查看代表峰值的点是如何覆盖热图图像的。
使用默认的估计和校正方法将质谱中的峰列表对齐。
[CMZ, aligned_peaks] = mspalign(ms_peaks);
重新采样未对齐的数据,在热图中显示它,然后覆盖一个点图。
[MZ2, Y2] = msppresample (aligned_peaks, 5000);msheatmap (MZ2 ret_time、日志(Y2))
msdotplot (aligned_peaks ret_time)
连接两个热图的轴线并放大观察细节,以比较未对齐和对齐的LC/MS数据集。
linkaxes (findobj (0,“标签”,“MSHeatMap”)轴([480 532 375 485])
参考文献
Jeffries, N.(2005)质谱蛋白质组学数据校准算法。Bioinfomatics21:14, 3066 - 3073。
Purvine, S., Kolker, N.和Kolker, E.(2004)用于高通量串联质谱蛋白质组学的光谱质量评估。组学:综合生物学杂志8:3, 255 - 265。
版本历史
介绍了R2007a