主要内容

建立判别分析模型

判别分析模型为:

  • 每节课(Y)生成数据(X),采用多元正态分布。换句话说,模型假设X为高斯混合分布(gmdistribution).

    • 对于线性判别分析,每个类的协方差矩阵相同;只是手段不同。

    • 对于二次判别分析,每一类的均值和协方差都是不同的。

在此建模假设下,fitcdiscr推断每个类的均值和协方差参数。

  • 对于线性判别分析,它计算每个类的样本均值。然后计算样本协方差,首先从每个类的观察中减去每个类的样本均值,然后取结果的经验协方差矩阵。

  • 对于二次判别分析,它计算每个类的样本均值。然后计算样本协方差,首先从每个类的观察数据中减去每个类的样本均值,然后取每个类的经验协方差矩阵。

适合方法不使用先验概率或成本进行拟合。

加权观测

fitcdiscr使用以下方案构造加权分类器。假设是一个N——- - - - - -K类成员矩阵:

nk观测值= 1n来自课堂k
nk否则= 0。

未加权数据的类均值估计为

μ k n 1 N n k x n n 1 N n k

对于具有正权重的加权数据wn,自然泛化为

μ k n 1 N n k w n x n n 1 N n k w n

未加权数据的合并协方差矩阵的无偏估计为

Σ n 1 N k 1 K n k x n μ k x n μ k T N K

对于二次判别分析,fitcdiscr使用K= 1

对于加权数据,假设权重之和为1,则合并协方差矩阵的无偏估计为

Σ n 1 N k 1 K n k w n x n μ k x n μ k T 1 k 1 K W k 2 W k

在哪里

  • W k n 1 N n k w n 是类别权重的和吗k

  • W k 2 n 1 N n k w n 2 是每个类权重的平方和。

另请参阅

功能

对象

相关的话题

Baidu
map