主要内容

预测

使用判别分析分类模型预测标签

描述

标签=预测(MdlX为表或矩阵中的预测器数据返回预测类标签的向量X,基于训练的判别分析分类模型Mdl

标签分数成本) =预测(MdlX返回:

  • 分类分数矩阵(分数)表示标签来自特定类的可能性。对于判别分析,得分为后验概率

  • 一个矩阵的预期成本分类成本).每项观察结果X,预测类别标签对应所有类别中期望分类成本最小的类别。

输入参数

全部展开

判别分析分类模型,具体为ClassificationDiscriminantCompactClassificationDiscriminant返回的模型对象fitcdiscr

要分类的预测数据,指定为数字矩阵或表格。

每一行的X对应一个观察结果,每一列对应一个变量。的所有预测变量X必须是数字向量。

  • 对于数值矩阵,组成列的变量X必须与训练的预测变量的顺序相同Mdl

  • 一个表:

    • 预测除了字符向量的单元格数组外,不支持多列变量和单元格数组。

    • 如果你训练Mdl使用一个表(例如,资源描述),则所有预测变量均为X必须具有与受训对象相同的变量名和数据类型Mdl(存储在Mdl。PredictorNames).的列顺序X是否需要对应列的顺序资源描述资源描述而且X可以包含额外的变量(响应变量、观察权重等),但是预测忽略了它们。

    • 如果你训练Mdl使用一个数字矩阵,然后预测器名称在Mdl。PredictorNames和对应的预测变量名X一定是一样的。若要在训练期间指定预测器名称,请参阅PredictorNames的名值对参数fitcdiscrX可以包含额外的变量(响应变量、观察权重等),但是预测忽略了它们。

数据类型:表格||

输出参数

全部展开

预测类标签,作为类别或字符数组、逻辑或数字向量或字符向量的单元格数组返回。

每项观察结果X,预测类别标签对应所有类别中期望分类成本最小的类别。对于观察分数,该函数将观察分为多数类,这在训练标签中所占的比例最大。

标签

  • 与观察到的类标签相同的数据类型(Y),训练Mdl(该软件将字符串数组视为字符向量的单元格数组。)

  • 长度是否等于的行数X

预测类后验概率,作为大小的数字矩阵返回N——- - - - - -KN观察数(行)在吗X,K班的数量(在?Mdl。ClassNames).评分(i, j)后验概率是观察到的吗X的类jMdl。ClassNames

预期成本分类,作为大小矩阵返回N——- - - - - -KN观察数(行)在吗X,K班的数量(在?Mdl。ClassNames).成本(i, j)行分类的成本是多少X作为类jMdl。ClassNames

例子

全部展开

载入费雪的虹膜数据集。确定样本大小。

负载fisheriris1) N =大小(量;

将数据划分为训练集和测试集。保留10%的数据用于测试。

rng (1);%的再现性本量利= cvpartition (N,“坚持”, 0.1);idxTrn =培训(cvp);%训练集指标idxTest =测试(cvp);%测试集索引

将训练数据存储在一个表中。

tblTrn = array2table(量(idxTrn:));tblTrn。Y=species(idxTrn);

使用训练集和默认选项训练判别分析模型。

Mdl = fitcdiscr (tblTrn,“Y”);

预测测试集的标签。你训练Mdl使用数据表,但可以使用矩阵预测标签。

标签=预测(Mdl量(idxTest:));

为测试集构造一个混淆矩阵。

confusionchart(物种(idxTest)、标签)

图包含一个类型为confusimatrixchart的对象。

Mdl在测试集中,将一个彩色鸢尾错误地分类为virginica。

载入费雪的虹膜数据集。考虑只使用花瓣的长度和宽度进行训练。

负载fisheririsX =量(:,3:4);

利用整个数据集训练一个二次判别分析模型。

Mdl = fitcdiscr (X,物种,“DiscrimType”“二次”);

在观察到的预测器空间中定义一个值的网格。预测网格中每个实例的后验概率。

xMax = max (X);xMin = min (X);d = 0.01;[x1Grid, x2Grid] = meshgrid (xMin (1): d: xMax (1) xMin (2): d: xMax (2));[~,分数]=预测(Mdl [x1Grid (:), x2Grid (:)));Mdl。ClassNames
ans =3 x1细胞{'setosa'} {'versicolor'} {'virginica'}

分数是类后验概率的矩阵。中的类对应这些列Mdl。ClassNames.例如,分数(j, 1)后验概率是观察到的吗j是鸢尾花。

在网格中绘制每个观察的多色分类的后验概率,并绘制训练数据。

图;contourf (x1Grid x2Grid,重塑(分数(:,2),大小(x1Grid, 1),大小(x1Grid, 2)));h = colorbar;caxis ([0 1]);colormap飞机;持有gscatter (X (: 1) X(:, 2),物种,“mcy”的方式来+);轴标题("五彩缤纷的后验概率");持有

图中包含一个axes对象。标题为“七彩后验概率”的坐标轴对象包含4个轮廓、直线类型的对象。这些物品代表了彩色,彩色,处女。

后验概率区域暴露了决策边界的一部分。

更多关于

全部展开

扩展功能

版本历史

介绍了R2011b

Baidu
map