主要内容

泰姬陵

与参考样本的马氏距离

描述

例子

d2=泰姬陵(YX返回的平方Mahalanobis距离的每一个观察结果Y的参考样本X

例子

全部折叠

生成相关的二元样本数据集。

rng (“默认”%的再现性X = mvnrnd([0;0],[1 .9;。9 1], 1000);

指定四个与均值等距的观测值X在欧氏距离。

Y = [1 1;1 -1;-1 1];

计算中每个观测值的马氏距离Y的参考样本X

d2_mahal =泰姬陵(Y, X)
d2_mahal =4×11.1095 20.3632 19.5939 1.0137

计算每一个观察结果的欧氏距离的平方Y的均值X

d2_Euclidean =总和((Y-mean (X)) ^ 2, 2)
d2_Euclidean =4×12.0931 2.0399 1.9625 1.9094

情节X而且Y通过使用散射用标记的颜色来表示马氏距离Y的参考样本X

散射(X (: 1) X(:, 2), 10日“。”点大小为10的散点图持有散射(Y (: 1), Y(:, 2), 100年,d2_mahal,“o”“填充”) hb = colorbar;ylabel (hb,“Mahalanobis距离”)传说(“X”“Y”“位置”“最佳”

图中包含一个axes对象。坐标轴对象包含两个散点类型的对象。这些对象代表X, Y。

所有的观察Y[1][1][1],[1]的平均值为等距X在欧氏距离。然而,[1]而且[1]比X更接近[1]而且[1]在距离。因为马氏距离考虑了数据的协方差和不同变量的尺度,它对检测异常值很有用。

输入参数

全部折叠

数据,用n——- - - - - -数字矩阵,n观察的次数和是每次观察中变量的数量。

X而且Y列数必须相同,但行数可以不同。

数据类型:|

参考样本,指定为p——- - - - - -数字矩阵,p样本的数量和是每个样本中变量的个数。

X而且Y列数必须相同,但行数可以不同。X行数必须大于列数。

数据类型:|

输出参数

全部折叠

的平方Mahalanobis距离的每一个观察结果Y的参考样本X,作为n-by-1数字向量,其中n观察的数量在吗X

更多关于

全部折叠

Mahalanobis距离

马氏距离是一个样本点和一个分布之间的度量。

到一个向量的马氏距离y有均值的分布μ和协方差Σ

d y μ 1 y μ

这个距离表示距离y是从标准差数的平均值。

泰姬陵返回马氏距离的平方d2根据一项在Y的参考样本X.在泰姬陵函数,μ而且Σ分别为参考样本的样本均值和协方差。

版本历史

之前介绍过的R2006a

Baidu
map