主要内容

ClassificationDiscriminant类

超类:CompactClassificationDiscriminant

判别分析分类

描述

一个ClassificationDiscriminant对象封装了一个判别分析分类器,它是一个用于数据生成的高斯混合模型。一个ClassificationDiscriminant对象可以预测新数据的响应预测方法。该对象包含用于训练的数据,因此可以计算再替换预测。

建设

创建一个ClassificationDiscriminant对象的使用fitcdiscr

属性

BetweenSigma

p——- - - - - -p矩阵,类间协方差,其中p是预测器的数量。

CategoricalPredictors

分类预测器索引,它总是空的([]) .

一会

训练数据中的元素列表Y删除重复的。一会可以是类别数组、字符向量的单元格数组、字符数组、逻辑向量或数字向量。一会是否与实参中的数据类型相同Y(该软件将字符串数组视为字符向量的单元格数组。)

多项式系数

k——- - - - - -k系数矩阵结构,其中k是类的数量。多项式系数(i, j)包含类之间线性或二次边界的系数而且j.字段多项式系数(i, j)

  • DiscrimType

  • Class1- - - - - -一会(我)

  • 类别2- - - - - -一会(j)

  • 常量——一个标量

  • 线性-一个向量p组件,p列数在吗X

  • 二次- - - - - -p——- - - - - -p矩阵,对于二次元存在DiscrimType

类与类之间的边界方程和类j

常量+线性x+x '二次x0

在哪里x列向量的长度是多少p

如果fitcdiscrFillCoeffs名称-值对设置为“关闭”在构造分类器时,多项式系数是空的([]).

成本

方阵,成本(i, j)将一个点分类到类的成本是多少j如果它真正的阶级是(即,行对应真正的类,列对应预测的类)。的行和列的顺序成本中的类的顺序一会.中的行数和列数成本是响应中惟一类的数量。

改变一个成本使用点表示法的矩阵:obj。成本=成本Matrix

δ

非负标量线性判别模型的δ阈值。如果系数为obj大小小于δobj将该系数设置为0,这样就可以从模型中剔除相应的预测因子。集δ到更高的值以消除更多的预测因子。

δ必须0对于二次判别模型。

改变δ使用点符号:obj。Delta = newDelta

DeltaPredictor

行向量的长度等于预测因子的个数obj.如果DeltaPredictor (i) <三角洲然后系数这个模型是0

如果obj是不是一个二次判别模型,所有元素的DeltaPredictor0

DiscrimType

指定鉴别类型的字符向量。之一:

  • “线性”

  • “二次”

  • “diagLinear”

  • “diagQuadratic”

  • “pseudoLinear”

  • “pseudoQuadratic”

改变DiscrimType使用点符号:obj。D我scrimType = newDiscrimType

可以在线性类型或二次类型之间进行更改,但不能在线性类型和二次类型之间进行更改。

γ

正则化参数的值,来自的标量01.改变γ使用点符号:obj。γ= newGamma

  • 如果你设置1对于线性鉴别器,鉴别器将其类型设置为“diagLinear”

  • 如果你设置一个值MinGamma而且1对于线性鉴别器,鉴别器将其类型设置为“线性”

  • 的值之下设置的值MinGamma财产。

  • 对于二次判别,你可以任意设置0(DiscrimType“二次”)或1(DiscrimType“diagQuadratic”).

HyperparameterOptimizationResults

超参数的交叉验证优化描述,存储为BayesianOptimization对象或超参数和关联值的表。非空的时OptimizeHyperparameters名称-值对在创建时非空。值取决于的设置HyperparameterOptimizationOptions创建时的名值对:

  • “bayesopt”(默认)-类的对象BayesianOptimization

  • “gridsearch”“randomsearch”-使用的超参数表,观测到的目标函数值(交叉验证损失),以及从最低(最好)到最高(最差)的观测值排名

LogDetSigma

类内协方差矩阵行列式的对数。的类型LogDetSigma取决于鉴别类型:

  • 标量线性判别分析

  • 向量的长度K对于二次判别分析,其中K是班级的数量吗

MinGamma

非负标量,参数的最小值,使相关矩阵可逆。如果相关矩阵不是奇异的,MinGamma0

ModelParameters

培训所用参数obj

μ

类的含义,指定为K——- - - - - -p矩阵的标量值类意味着大小。K是多少班,和p是预测器的数量。每一行的μ表示对应类的多元正态分布的均值。类索引在一会属性。

NumObservations

训练数据中的观察数,一个数值标量。NumObservations可以小于输入数据的行数吗X中缺少值时X或响应Y

PredictorNames

预测变量名称的单元格数组,按它们在训练数据中出现的顺序排列X

之前

每种类别的先验概率的数字向量。元素的顺序之前中的类的顺序一会

添加或更改之前向量使用点表示法:obj。Prior = priorVector

ResponseName

描述响应变量的字符向量Y

ScoreTransform

表示内置转换函数的字符向量,或用于转换分数的函数句柄。“没有”意味着没有转换;同样,“没有”意味着@ x (x).有关内置转换函数的列表和自定义转换函数的语法,请参见fitcdiscr

实现点表示法来添加或更改ScoreTransform函数使用下列之一:

  • cobj。ScoreTransform = '函数

  • cobj。ScoreTransform = @函数

σ

类内协方差矩阵或矩阵。尺寸取决于DiscrimType

  • “线性”(默认)-大小矩阵p——- - - - - -p,在那里p是预测因子的数量吗

  • “二次”-数组的大小p——- - - - - -p——- - - - - -K,在那里K是班级的数量吗

  • “diagLinear”-长度的行向量p

  • “diagQuadratic”-数组的大小1——- - - - - -p——- - - - - -K

  • “pseudoLinear”-尺寸矩阵p——- - - - - -p

  • “pseudoQuadratic”-数组的大小p——- - - - - -p——- - - - - -K

W

按比例缩小的权重,一个有长度的向量n的行数X

X

预测值矩阵。每一列的X表示一个预测器(变量),每一行表示一个观察结果。

Xcentered

X减去带有类均值的数据。如果Y(我)的类j

Xcentered(我,:)X(我,:)- - - - - -μ(j,:)

在哪里μ是类的均值属性。

Y

具有相同行数的分类数组、字符向量的单元格数组、字符数组、逻辑向量或数字向量X.每一行的Y的对应行的分类X

对象的功能

紧凑的 紧凑的判别分析分类器
compareHoldout 使用新数据比较两种分类模型的准确性
crossval 交叉验证判别分析分类器
cvshrink 线性判别式的交叉验证正则化
边缘 分类的优势
石灰 局部可解释模型不可知解释(LIME)
logp 对数无条件概率密度判别分析分类器
损失 分类错误
泰姬陵 马氏距离对分类器的判别分析方法
保证金 分类的利润率
nLinearCoeffs 非零线性系数的个数
partialDependence 计算部分依赖
plotPartialDependence 创建偏依赖图(PDP)和个体条件期望图(ICE)
预测 使用判别分析分类模型预测标签
resubEdge 用复代法分类边缘
resubLoss 由替换引起的分类错误
resubMargin 用复代法分类边界
resubPredict 预测判别分析分类模型的替代标签
沙普利 沙普利值
testckfold 通过重复交叉验证比较两种分类模型的准确性

复制语义

价值。要了解值类如何影响复制操作,请参见复制对象

例子

全部折叠

载入费雪的虹膜数据集。

负载fisheriris

利用整个数据集训练一个判别分析模型。

Mdl = fitcdiscr(量、物种)
Mdl = ClassificationDiscriminant ResponseName: 'Y' CategoricalPredictors: [] ClassNames: {'setosa' 'versicolor' 'virginica'} ScoreTransform: 'none' NumObservations: 150 discritype: 'linear' Mu: [3x4 double] Coeffs: [3x3 struct]属性,方法

Mdl是一个ClassificationDiscriminant模型。要访问其属性,请使用点表示法。例如,显示每个预测器的组均值。

Mdl。μ
ans =3×45.0060 3.4280 1.4620 0.2460 5.9360 2.7700 4.2600 1.3260 6.5880 2.9740 5.5520 2.0260

为了预测新的观察结果的标签,通过Mdl和预测数据预测

更多关于

全部展开

参考文献

[1]郭,Y., T.哈斯蒂,R.蒂布希拉尼。正则化线性判别分析及其在微阵列中的应用。生物统计学,2007年第8卷第1期,86-100页。

扩展功能

版本历史

介绍了R2011b

Baidu
map