mspalign

从LC/MS或GC/MS数据集的多个峰值列表中对齐质谱

语法

［CMZ，AlignedPeaks) = mspalign (Peaklist）［CMZ，AlignedPeaks) = mspalign (Peaklist,“分位数”,QuantileValue,……) ［CMZ，AlignedPeaks) = mspalign (Peaklist……“EstimationMethod”,EstimationMethodValue,……) ［CMZ，AlignedPeaks) = mspalign (Peaklist……“CorrectionMethod”,CorrectionMethodValue,……) ［CMZ，AlignedPeaks) = mspalign (Peaklist……“ShowEstimation”,ShowEstimationValue,……)

输入参数

`Peaklist`	来自液相色谱/质谱(LC/MS)或气相色谱/质谱(GC/MS)数据集的峰列表细胞阵列。细胞阵列中的每个元素都是一个两列矩阵，第一列为m/z值，第二列为离子强度值。每个元素对应一个光谱或保留时间。请注意您可以使用`mzxml2peaks`函数或`mspeaks`函数来创建`Peaklist`单元阵列。
`QuantileValue`	值，该值确定由估计方法选择要创建的峰值`CMZ`为m/z值的向量。选择是任意值`≥0`而且`≤1`．默认是`0.95`．
`EstimationMethodValue`	指定估计方法的字符向量或字符串`CMZ`，为常见质量/电荷(m/z)值的向量。的选择是: `柱状图`——默认的方法。使用核密度估计方法对峰值位置进行聚类。峰值离子强度被用作权重因子。所有簇的中心都符合`CMZ`向量。 `回归`-取观察到的显著峰间距离的样本，并对峰间距离进行回归，以创建`CMZ`具有相似元素间距离的向量。
`CorrectionMethodValue`	字符向量或字符串，指定将每个峰值列表对齐到`CMZ`向量。的选择是: `加权`——默认的方法。对于每一个共同的高峰`CMZ`向量，它在每个峰值表中的对应值是最接近公共峰值的m/z值的峰值。 `最短路径`-对于每个共同的高峰`CMZ`向量，它在每个峰值列表中的对应点使用最短路径算法选择。
`ShowEstimationValue`	控制相对于估计方法和通用质量/电荷(m/z)值的向量的评估图的显示。的选择是`真正的`或`假`．默认是: `假`—当指定返回值时。 `真正的`—当没有指定返回值时。

输出参数

`CMZ`	常用的质量/电荷(m/z)值的向量`mspalign`函数。
`AlignedPeaks`	单元格阵列的峰值列表，具有相同的形式`Peaklist`，但每个矩阵第一列的m/z值都经过了修正。

描述

［CMZ，AlignedPeaks) = mspalign (Peaklist）通过首次估计，从多个峰表(中心化数据)对齐质谱CMZ的所有谱峰估计的共同质量/电荷(m/z)值的向量Peaklist，一个峰列表的单元数组，其中每个元素对应一个频谱或保留时间。然后将每个谱中的峰值与中的值对齐CMZ,创造AlignedPeaks，对齐峰值列表的单元格数组。

［CMZ，AlignedPeaks) = mspalign (Peaklist,……”PropertyName'，PropertyValue,……)调用mspalign使用属性名/属性值对的可选属性。可以以任意顺序指定一个或多个属性。每一个PropertyName必须用单引号括起来，不区分大小写。这些属性名/属性值对如下:

［CMZ，AlignedPeaks) = mspalign (Peaklist,“分位数”,QuantileValue,……)确定由估计方法选择要创建的峰值CMZ为m/z值的向量。选择是一个标量0而且1．默认是0.95．

［CMZ，AlignedPeaks) = mspalign (Peaklist……“EstimationMethod”,EstimationMethodValue,……)指定用于估计的方法CMZ，为常见质量/电荷(m/z)值的向量。的选择是:

柱状图——默认的方法。使用核密度估计方法对峰值位置进行聚类。峰值离子强度被用作权重因子。所有簇的中心都符合CMZ向量。
回归-取观察到的显著峰间距离的样本，并对峰间距离进行回归，以创建CMZ具有相似元素间距离的向量。

［CMZ，AlignedPeaks) = mspalign (Peaklist……“CorrectionMethod”,CorrectionMethodValue,……)指定用于将每个峰值列表与CMZ向量。的选择是:

加权——默认的方法。对于每一个共同的高峰CMZ向量，它在每个峰值表中的对应值是最接近公共峰值的m/z值的峰值。
最短路径-对于每个共同的高峰CMZ向量，它在每个峰值列表中的对应点使用最短路径算法选择。

［CMZ，AlignedPeaks) = mspalign (Peaklist……“ShowEstimation”,ShowEstimationValue,……)控制相对于估计方法和通用质量/电荷(m/z)值的估计向量的评估图的显示。的选择是真正的或假．默认是:

假—当指定返回值时。
真正的—当没有指定返回值时。

例子

加载一个mat文件，包括生物信息学工具箱™软件，其中包含液相色谱/质谱(LC/MS)数据变量，包括山峰而且ret_time．山峰是峰值列表的单元数组，其中每个元素是m/z值和离子强度值的两列矩阵，每个元素对应于光谱或保留时间。ret_time是与LC/MS数据集相关的留存时间的列向量。
```
负载lcmsdata
```

重新采样未对齐的数据，在热图中显示它，然后覆盖一个点图。

(MZ, Y) = msppresample (ms_peaks, 5000);msheatmap (MZ, ret_time日志(Y))

msdotplot (ms_peaks ret_time)

点击放大按钮，然后单击点图两到三次，放大并查看代表峰值的点是如何覆盖热图图像的。
使用默认的估计和校正方法将质谱中的峰列表对齐。
```
[CMZ, aligned_peaks] = mspalign(ms_peaks);
```

重新采样未对齐的数据，在热图中显示它，然后覆盖一个点图。

[MZ2, Y2] = msppresample (aligned_peaks, 5000);msheatmap (MZ2 ret_time、日志(Y2))

msdotplot (aligned_peaks ret_time)

连接两个热图的轴线并放大观察细节，以比较未对齐和对齐的LC/MS数据集。
```
linkaxes (findobj (0,“标签”，“MSHeatMap”)轴([480 532 375 485])
```

参考文献

Jeffries, N.(2005)质谱蛋白质组学数据校准算法。Bioinfomatics21:14, 3066 - 3073。

Purvine, S.， Kolker, N.和Kolker, E.(2004)用于高通量串联质谱蛋白质组学的光谱质量评估。组学:综合生物学杂志8:3, 255 - 265。

版本历史

介绍了R2007a

另请参阅