建立判别分析模型
判别分析模型为:
每节课(
Y
)生成数据(X
),采用多元正态分布。换句话说,模型假设X
为高斯混合分布(gmdistribution
).对于线性判别分析,每个类的协方差矩阵相同;只是手段不同。
对于二次判别分析,每一类的均值和协方差都是不同的。
在此建模假设下,fitcdiscr
推断每个类的均值和协方差参数。
对于线性判别分析,它计算每个类的样本均值。然后计算样本协方差,首先从每个类的观察中减去每个类的样本均值,然后取结果的经验协方差矩阵。
对于二次判别分析,它计算每个类的样本均值。然后计算样本协方差,首先从每个类的观察数据中减去每个类的样本均值,然后取每个类的经验协方差矩阵。
的适合
方法不使用先验概率或成本进行拟合。
加权观测
fitcdiscr
使用以下方案构造加权分类器。假设米是一个N——- - - - - -K类成员矩阵:
米nk观测值= 1n来自课堂k
米nk否则= 0。
未加权数据的类均值估计为
对于具有正权重的加权数据wn,自然泛化为
未加权数据的合并协方差矩阵的无偏估计为
对于二次判别分析,fitcdiscr
使用K= 1.
对于加权数据,假设权重之和为1,则合并协方差矩阵的无偏估计为
在哪里
是类别权重的和吗k.
是每个类权重的平方和。