主要内容

partialDependence

计算部分依赖

描述

例子

pd= partialDependence (RegressionMdlvar计算偏依赖关系pd中列出的预测变量之间var并利用回归模型进行预测RegressionMdl,其中包含预测数据。

例子

pd= partialDependence (ClassificationMdlvar标签计算偏依赖关系pd中列出的预测变量之间var以及指定课程的分数标签通过使用分类模型ClassificationMdl,其中包含预测数据。

pd= partialDependence (___数据使用新的预测数据数据.您可以指定数据除了前面语法中的任何输入参数组合之外。

例子

pd= partialDependence (有趣的var数据计算中列出的预测变量之间的偏相关关系var和自定义模型返回的输出有趣的,使用预测数据数据

例子

pd= partialDependence (___名称,值使用由一个或多个名称-值参数指定的其他选项。例如,如果您指定“UseParallel”,“真正的”,partialDependence函数使用并行计算来执行部分依赖计算。

pdxy) = partialDependence (___同样的回报x而且y,其中包含第一个和第二个预测变量的查询点var,分别。如果指定一个变量var,然后partialDependence返回一个空矩阵([])y

例子

全部折叠

训练朴素贝叶斯分类模型fisheriris数据集,并计算偏依赖值,显示预测变量和多个类的预测得分(后验概率)之间的关系。

加载fisheriris数据集,其中包含物种(物种)及测量()对150个鸢尾标本的萼片长度、萼片宽度、花瓣长度和花瓣宽度的影响。数据集包含三个物种的各50个标本:濑蝶、百色蝶和处女蝶。

负载fisheriris

训练朴素贝叶斯分类模型物种作为响应和为预测因子。

Mdl = fitcnb(量、种类、“PredictorNames”,[“花萼长度”“花萼宽”“花瓣长度”“花瓣宽度”]);

计算分数的第三个预测变量(花瓣长度)的偏依赖值Mdl对于所有三类物种.方法指定类标签一会的属性Mdl

(pd, x) = partialDependence (Mdl 3 Mdl.ClassNames);

pd包含查询点x的偏依赖值。您可以使用绘图函数来绘制计算出的偏依赖值情节而且酒吧.情节pd反对x通过使用酒吧函数。

栏(x, pd)传说(Mdl.ClassNames)包含(“花瓣长度”) ylabel (“分数”)标题(“部分依赖阴谋”

图中包含一个axes对象。标题为Partial dependency Plot的axis对象包含3个类型为bar的对象。这些物品代表了彩色,彩色,处女。

根据这个模型,的概率virginica随花瓣长度增加。的概率setosa大约是0.33,从花瓣长度为0到2.5左右,然后概率下降到几乎为0。

或者,您也可以使用plotPartialDependence函数来计算和绘制偏相关值。

plotPartialDependence (Mdl 3 Mdl.ClassNames)

图中包含一个axes对象。标题为Partial dependency Plot的axis对象包含3个类型为line的对象。这些物品代表了彩色,彩色,处女。

训练分类模型的集合,计算多个类的两个变量的偏依赖值。然后绘制每个类的偏依赖值。

加载census1994数据集,包含美国的年薪数据,分类为< = 50 k> 50 k,以及几个人口统计变量。

负载census1994

从表中提取要分析的变量子集adultdata

X = adultdata (1:50 0,“年龄”“workClass”“education_num”“marital_status”“种族”...“性”“capital_gain”“capital_loss”“hours_per_week”“工资”]);

训练分类树的随机森林fitcensemble并指定方法为“袋”.为了再现性,使用使用创建的树模板templateTree可再生的选择。

rng (“默认”t = templateTree(“复制”,真正的);Mdl = fitcensemble (X,“工资”“方法”“包”“学习者”t);

中的类名Mdl

Mdl。ClassNames
ans =2 x1分类< = 50 k > 50 k

计算分数对预测因子的部分依赖值年龄而且education_num对于这两个类(< = 50 k而且> 50 k).指定要采样的观察数为100。

(pd, x, y) = partialDependence (Mdl, (“年龄”“education_num”), Mdl。ClassNames,“NumObservationsToSample”, 100);

为第一个类(< = 50 k),请使用冲浪函数。

图冲浪(x, y,挤压(pd(1::)))包含(“年龄”) ylabel (“教育\ _num”) zlabel (“班级成绩<=50K”)标题(“部分依赖阴谋”30)视图([130])修改查看角度

图中包含一个axes对象。标题为Partial dependency Plot的axis对象包含一个类型为surface的对象。

为第二类(> 50 k).

图冲浪(x, y,挤压(pd(2::)))包含(“年龄”) ylabel (“教育\ _num”) zlabel (“>级成绩50K”)标题(“部分依赖阴谋”30)视图([130])修改查看角度

图中包含一个axes对象。标题为Partial dependency Plot的axis对象包含一个类型为surface的对象。

根据类的不同,两个图显示出不同的部分依赖模式。

训练支持向量机(SVM)回归模型carsmall数据集,并计算对两个预测变量的偏依赖性。然后,创建一个显示对两个变量的部分依赖关系的图,以及每个变量的直方图。

加载carsmall数据集。

负载carsmall

创建一个包含重量气缸位移,马力

台=表(重量、汽缸、排量、马力);

中的预测变量训练支持向量机回归模型资源描述响应变量英里/加仑.使用具有自动核尺度的高斯核函数。

Mdl = fitrsvm (MPG(资源,“ResponseName”“英里”...“CategoricalPredictors”“气缸”“标准化”,真的,...“KernelFunction”“高斯”“KernelScale”“汽车”);

计算预测响应的部分相关性(英里/加仑)的预测变量重量而且马力.方法指定计算部分依赖关系的查询点QueryPoints名称-值参数。

numPoints = 10;ptX = linspace (min(重量),max(重量),numPoints) ';企业= linspace (min(马力),max(马力),numPoints) ';(pd, x, y) = partialDependence (Mdl, (“重量”“马力”),“QueryPoints”, (ptX企业]);

创建一个包含5 × 5平铺图表布局的图。函数绘制对两个变量的部分依赖关系显示亮度图像函数。函数绘制每个变量的直方图柱状图函数。指定直方图的边缘,以便直方图条的中心与查询点对齐。更改轴线属性以对齐图的轴线。

t = tiledlayout (5 5“TileSpacing”“紧凑”);ax₁= nexttile (2 (4, 4));显示亮度图像(x, y, pd)标题(“部分依赖阴谋”) colorbar (“eastoutside”ax₁。YDir =“正常”;ax2 = nexttile(22日[1,4]);dX = diff (ptX (1:2));edgeX = [ptX-dX / 2; ptX(结束)+ dX);直方图(重量,edgeX);包含(“重量”) xlim (ax1.XLim);ax3 = nexttile (1, 4, 1]);dY = diff(企业(1:2));edgeY = [ptY-dY / 2;企业(结束)+ (dY);直方图(马力,edgeY)包含(“马力”) xlim (ax1.YLim);ax3。XDir =“反向”;camroll (-90)

图中包含3个轴对象。标题为Partial dependency Plot的axis对象1包含一个类型为image的对象。Axes对象2包含一个直方图类型的对象。Axes对象3包含一个直方图类型的对象。

的每个元素pd指定图像图形的一个像素的颜色。与图像轴线对齐的直方图显示了预测因子的分布。

计算a的标签分数对预测变量的偏依赖性SemiSupervisedSelfTrainingModel对象。你不能通过SemiSupervisedSelfTrainingModel对象直接指向partialDependence函数。相反,应该定义一个自定义函数,该函数返回对象的标签得分,然后将该函数传递给partialDependence

随机生成标记数据的15个观察值,三个类中每个类有5个观察值。

rng (“默认”%的再现性labeledX = [randn(5,2)*0.25 + ones(5,2);randn (5,2) * 0.25 - 1 (2);randn (5,2) * 0.5);Y =[(5、1)的;(5、1)* 2;(1) * 3);

随机生成300个未标记数据的额外观察值,每个类100个观察值。

unlabeledX = [randn(100,2)*0.25 + ones(100,2);randn (100 2) * 0.25 - 1 (100 2);randn (100 2) * 0.5);

利用半监督自训练方法将标签拟合到未标记的数据中。这个函数fitsemiself返回一个SemiSupervisedSelfTrainingModel对象。

Mdl = fitsemiself (labeledX Y unlabeledX);

定义自定义函数myLabelScores方法计算的标签分数预测的函数SemiSupervisedSelfTrainingModel;自定义函数定义出现在本例结束

计算分数的偏依赖性unlabeledX在所有类的每个变量上。partialDependence接受函数句柄形式的自定义模型。由函数句柄表示的函数必须接受预测器数据,并为每个观察结果返回一行的列向量或矩阵。将自定义模型指定为@ (X) myLabelScores (Mdl X)自定义函数使用训练过的模型Mdl并接受预测数据。

(pd1 x1) = partialDependence (@ (X) myLabelScores (Mdl X), 1, unlabeledX);(pd2 x2) = partialDependence (@ (X) myLabelScores (Mdl X), 2, unlabeledX);

可以使用绘图函数来绘制计算出的部分依赖值情节而且酒吧.或者,您也可以使用plotPartialDependence函数来计算和绘制偏相关值。

为第一个变量和所有类创建偏依赖图。

plotPartialDependence (@ (X) myLabelScores (Mdl X), 1, unlabeledX)包含(" unlabeledX的第一个变量") ylabel (“分数”)传说(“1级”“二班”“3班”

图中包含一个axes对象。标题为Partial dependency Plot的axis对象包含3个类型为line的对象。这些对象代表类1、类2、类3。

自定义函数myLabelScores

函数= myLabelScores(Mdl,X) [~,scores] = predict(Mdl,X);结束

输入参数

全部折叠

回归模型,指定为完整或紧凑的回归模型对象,如下表所示的所支持的模型。

模型 完整或紧凑模型对象
广义线性模型 GeneralizedLinearModelCompactGeneralizedLinearModel
广义线性混合效应模型 GeneralizedLinearMixedModel
线性回归 LinearModelCompactLinearModel
线性混合效应模型 LinearMixedModel
非线性回归 NonLinearModel
回归模型集合 RegressionEnsembleRegressionBaggedEnsembleCompactRegressionEnsemble
广义相加模型(GAM) RegressionGAMCompactRegressionGAM
高斯过程回归 RegressionGPCompactRegressionGP
采用随机特征展开的高斯核回归模型 RegressionKernel
高维数据的线性回归 RegressionLinear
神经网络回归模型 RegressionNeuralNetworkCompactRegressionNeuralNetwork
支持向量机(SVM)回归 RegressionSVMCompactRegressionSVM
回归树 RegressionTreeCompactRegressionTree
用于决策树集成的引导聚合 TreeBaggerCompactTreeBagger

如果RegressionMdl是否模型对象不包含预测器数据(例如,紧凑模型),必须提供输入参数数据

partialDependence不支持用稀疏矩阵训练的模型对象。训练模型时,使用完整的数字矩阵或表作为预测数据,其中行对应于单个观察结果。

分类模型,指定为完整或紧凑的分类模型对象,如下面支持的模型表所示。

模型 完整或紧凑模型对象
判别分析分类器 ClassificationDiscriminantCompactClassificationDiscriminant
支持向量机或其他分类器的多类模型 ClassificationECOCCompactClassificationECOC
学习者集合进行分类 ClassificationEnsembleCompactClassificationEnsembleClassificationBaggedEnsemble
广义相加模型(GAM) ClassificationGAMCompactClassificationGAM
基于随机特征展开的高斯核分类模型 ClassificationKernel
k最近的邻居分类器 ClassificationKNN
线性分类模型 ClassificationLinear
多类朴素贝叶斯模型 ClassificationNaiveBayesCompactClassificationNaiveBayes
神经网络分类器 ClassificationNeuralNetworkCompactClassificationNeuralNetwork
支持向量机(SVM)分类器用于单类和二元分类 ClassificationSVMCompactClassificationSVM
用于多类分类的二叉决策树 ClassificationTreeCompactClassificationTree
决策树的袋装集合 TreeBaggerCompactTreeBagger

如果ClassificationMdl是否模型对象不包含预测器数据(例如,紧凑模型),必须提供输入参数数据

partialDependence不支持用稀疏矩阵训练的模型对象。训练模型时,使用完整的数字矩阵或表作为预测数据,其中行对应于单个观察结果。

自定义模型,指定为函数句柄。函数处理有趣的必须表示一个接受预测器数据的函数数据并以列向量或矩阵的形式返回输出。输出的每一行必须对应于预测器数据中的每一个观察(行)。

默认情况下,partialDependence的所有输出列有趣的对于偏相关的计算。属性可以指定要使用的输出列OutputColumns名称-值参数。

如果预测数据(数据)在一个表中,partialDependence如果变量是逻辑向量、分类向量、字符数组、字符串数组或字符向量的单元格数组,则假定该变量是分类的。如果预测数据是一个矩阵,partialDependence假设所有的预测器都是连续的。要将任何其他预测器标识为类别预测器,请使用CategoricalPredictors名称-值参数。

数据类型:function_handle

预测变量,指定为正整数的向量、字符向量、字符串标量、字符串数组或字符向量的单元格数组。您可以指定一个或两个预测变量,如下表所示。

一个预测变量

价值 描述
正整数 预测器数据列对应的索引值。
字符向量或字符串标量

预测变量的名称。中的条目必须匹配PredictorNames财产RegressionMdl而且ClassificationMdl的变量名数据在自定义模型的表中有趣的

两个预测变量

价值 描述
两个正整数的向量 与预测器数据列对应的索引值。
字符向量的字符串数组或单元格数组

预测变量的名称。数组中的每个元素都是一个预测变量的名称。中的条目必须匹配PredictorNames财产RegressionMdl而且ClassificationMdl的变量名数据在自定义模型的表中有趣的

例子:[" x1”、“x3”)

数据类型:||字符|字符串|细胞

类标签,指定为类别或字符数组、逻辑或数字向量或字符向量的单元格数组。中的值和数据类型标签中的类名必须匹配一会的属性ClassificationMdlClassificationMdl。一会).

可以指定一个或多个类标签。

此参数仅在指定分类模型对象时有效ClassificationMdl

例子:(“红”、“蓝色”)

例子:ClassificationMdl。3类名([1])指定标签作为第一和第三类在ClassificationMdl

数据类型:||逻辑|字符|细胞|分类

预测数据,指定为数值矩阵或表格。每一行的数据对应一个观察结果,每一列对应一个变量。

对于回归模型(RegressionMdl)和分类模型(ClassificationMdl),数据必须与训练模型的预测器数据一致,存储在X变量财产。

  • 如果使用数字矩阵训练模型,那么数据一定是一个数字矩阵。组成列的变量数据必须具有与训练模型的预测变量相同的数量和顺序。

  • 如果使用表(例如,资源描述),然后数据一定是一张桌子。的所有预测变量数据必须具有与中的名称和类型相同的变量名和数据类型资源描述.的列顺序数据是否需要对应列的顺序资源描述

  • 数据一定不能稀疏。

如果指定的回归或分类模型不包含预测器数据,则必须提供数据.如果模型是包含预测器数据的完整模型对象,并且您指定数据参数,然后partialDependence忽略模型中的预测器数据并使用数据只有。

如果您指定一个自定义模型有趣的,你必须提供数据

数据类型:||表格

名称-值参数

指定可选参数对为Name1 = Value1,…,以=家,在那里的名字参数名称和价值对应的值。名-值参数必须出现在其他参数之后,但对的顺序并不重要。

在R2021a之前,名称和值之间用逗号隔开,并括起来的名字在报价。

例子:partialDependence (Mdl、var、数据“NumObservationsToSample”,100年,“UseParallel”,真的)中使用100个采样观察值计算偏依赖值数据和执行-并行循环迭代。

标志在部分依赖计算中包括广义加性模型(GAM)的交互项,指定为真正的.这个论点只对GAM有效。也就是说,只有当RegressionMdlRegressionGAMCompactRegressionGAM,或ClassificationMdlClassificationGAMCompactClassificationGAM

默认的IncludeInteractions值是真正的如果模型包含交互项。取值必须为如果模型不包含交互项。

例子:“IncludeInteractions”,假的

数据类型:逻辑

标志,在偏依赖计算中包括广义相加模型(GAM)的拦截项,指定为真正的.这个论点只对GAM有效。也就是说,只有当RegressionMdlRegressionGAMCompactRegressionGAM,或ClassificationMdlClassificationGAMCompactClassificationGAM

例子:“IncludeIntercept”,假的

数据类型:逻辑

要抽样的观察数,指定为正整数。默认值为年的总观察数数据或模型(RegressionMdlClassificationMdl).如果指定的值大于总观察数,则partialDependence使用所有的观察。

partialDependence样本观察不替换使用datasample函数,并利用抽样观测值计算偏相关。

例子:“NumObservationsToSample”,100

数据类型:|

点用于计算数值预测器的部分依赖关系,指定为数值列向量、数值双列矩阵或两个数值列向量组成的单元格数组。

  • 如果你选择一个预测变量var,使用数值列向量。

  • 如果选择两个预测变量var

    • 使用数字双列矩阵为每个预测变量指定相同数量的点。

    • 使用两个数值列向量的单元格数组为每个预测变量指定不同数量的点。

默认值是数值列向量或数值双列矩阵,具体取决于所选预测变量的数量。每一列包含对应预测变量的采样观测值的最小值和最大值之间的100个均匀间隔点。

您不能修改QueryPoints对于一个类别变量。的partialDependence函数使用所选变量中的所有分类值。

如果选择一个数值变量和一个类别变量,则可以指定QueryPoints对于数值变量,使用由数值列向量和空数组组成的单元格数组。

例子:“QueryPoints”{pt, []}

数据类型:||细胞

标志以并行运行,指定为真正的.如果您指定“UseParallel”,真的,partialDependence函数执行-循环迭代并行使用parfor当预测每个观察结果的反应或分数并取平均值时。此选项需要并行计算工具箱™。

例子:“UseParallel”,真的

数据类型:逻辑

自定义模型的分类预测器列表有趣的,指定为该表中的一个值。

价值 描述
正整数向量

向量中的每个条目都是一个索引值,指示对应的预测器是分类的。索引值在1和之间p,在那里p变量的数量在吗数据

逻辑向量

一个真正的入口意味着对应的预测因子是绝对的。向量的长度是p

字符矩阵 矩阵的每一行都是一个预测变量的名称。名称必须与预测器数据的变量名称相匹配数据在一个表中。用额外的空格填充名字,这样字符矩阵的每一行都有相同的长度。
字符向量的字符串数组或单元格数组 数组中的每个元素都是一个预测变量的名称。名称必须与预测器数据的变量名称相匹配数据在一个表中。
“所有” 所有的预测都是绝对的。

默认情况下,如果预测器数据数据在一个表中,partialDependence如果变量是逻辑向量、分类向量、字符数组、字符串数组或字符向量的单元格数组,则假定该变量是分类的。如果预测数据是一个矩阵,partialDependence假设所有的预测器都是连续的。要将任何其他预测器标识为类别预测器,请使用CategoricalPredictors名称-值参数。

此参数仅在使用指定自定义模型时有效有趣的

例子:“CategoricalPredictors”、“所有”

数据类型:||逻辑|字符|字符串|细胞

自定义模型的输出列有趣的用于部分依赖计算,指定为该表中的一个值。

价值 描述
正整数向量

向量中的每个条目都是指示这一点的索引值partialDependence使用相应的输出列进行偏相关计算。索引值在1和之间,在那里自定义模型是否返回输出矩阵中的列数有趣的

逻辑向量

一个真正的条目意味着partialDependence使用相应的输出列进行偏相关计算。向量的长度是

“所有” partialDependence使用所有输出列进行部分依赖计算。

此参数仅在使用指定自定义模型时有效有趣的

例子:“OutputColumns”,[1 - 2]

数据类型:||逻辑|字符|字符串

输出参数

全部折叠

部分依赖值,作为数值数组返回。

的维数pd取决于模型的类型(回归、分类或自定义)、中指定的变量数量var中指定的类的数量标签(仅适用于分类模型),以及中指定的列数OutputColumns(自定义模型只)。

对于回归模型(RegressionMdl),适用下列条件:

  • 如果指定两个变量varpd是一个numY——- - - - - -numX矩阵,numY而且numX第二个和第一个变量的查询点的数量是否在var,分别。的价值pd (i, j)查询点的部分依赖值是否对应于y(我)而且x(j)y(我)第二个预测变量的第一个查询点,和x(j)j第一个预测变量的第一个查询点。

  • 如果指定一个变量varpd是一个1——- - - - - -numX向量。

对于分类模型(ClassificationMdl),适用下列条件:

  • 如果指定两个变量varpd是一个全国矿工工会——- - - - - -numY——- - - - - -numX数组,全国矿工工会类标签的数量在吗标签.的价值pd (i, j, k)查询点的部分依赖值y(j)而且x(k)类别标签标签

  • 如果指定一个变量varpd是一个全国矿工工会——- - - - - -numX矩阵。

  • 中指定一个类标签pd是一个numY——- - - - - -numX矩阵。

  • 如果指定一个变量和一个类,pd是一个1——- - - - - -numX向量。

对于自定义模型(有趣的),适用下列条件:

  • 如果指定两个变量varpd是一个全国矿工工会——- - - - - -numY——- - - - - -numX数组,全国矿工工会输出列数是否在OutputColumns.的价值pd (i, j, k)查询点的部分依赖值y(j)而且x(k)th列OutputColumns

  • 如果指定一个变量varpd是一个全国矿工工会——- - - - - -numX矩阵。

  • 中指定一列OutputColumnspd是一个numY——- - - - - -numX矩阵。

  • 如果指定一个变量和一列,pd是一个1——- - - - - -numX向量。

中第一个预测变量的查询点var,作为数值或类别列向量返回。

方法指定查询点,如果预测器变量是数值型的QueryPoints名称-值参数。

数据类型:||分类

中的第二个预测变量的查询点var,作为数值或类别列向量返回。输出参数为空([])如果只指定一个变量var

方法指定查询点,如果预测器变量是数值型的QueryPoints名称-值参数。

数据类型:||分类

更多关于

全部折叠

回归模型的偏依赖性

部分依赖[1]表示经过训练的回归模型中预测变量和预测响应之间的关系。partialDependence通过对其他变量的边缘化,计算预测响应对预测变量子集的部分依赖。

考虑对子集的部分依赖X年代整个预测变量集的X= {x1x2、……x.一个子集X年代包括一个变量或两个变量:X年代= {xS1X年代= {xS1xS2.让XC是的互补集X年代X.预测的响应fX)取决于中的所有变量X

fX) =fX年代XC).

预测响应的部分依赖性X年代是由预测响应的期望定义的XC

f 年代 X 年代 E C f X 年代 X C f X 年代 X C p C X C d X C

在哪里pCXC的边际概率XC,也就是说, p C X C p X 年代 X C d X 年代 .假设每个观察结果都是等可能的,和之间的依赖关系X年代而且XC和相互作用X年代而且XC回应并不强烈,partialDependence利用观测到的预测数据估计部分相关性如下:

f 年代 X 年代 1 N 1 N f X 年代 X C (1)

在哪里N观察的次数和X= (X年代XC观察。

当你打电话给partialDependence函数,您可以指定一个经过训练的模型(f(·))和选择变量(X年代),使用输入参数RegressionMdl而且var,分别。partialDependence的100个均匀间隔点处计算偏依赖关系X年代或者你指定的点QueryPoints名称-值参数。您可以指定数字(N)从给定的预测数据中抽样NumObservationsToSample名称-值参数。

部分依赖分类模型

就分类模型而言,partialDependence以与回归模型相同的方式计算部分依赖关系,只有一个例外:该函数不使用来自模型的预测响应,而是使用中指定的类的预测得分标签

加权算法遍历

加权遍历算法[1]是一种估计基于树的模型的部分依赖性的方法。估计的部分相关性是响应的加权平均值或在树遍历期间访问的叶节点对应的评分值。

X年代是整个变量集的子集X而且XC是的互补集X年代X.为每一个X年代值来计算部分依赖性,算法从根(开始)节点到叶(终端)节点遍历树,并查找叶节点的权值。遍历首先在根节点上分配1的权重值。如果一个节点分裂X年代时,算法遍历到适当的子节点X年代价值。子节点的权值将与其父节点的值相同。如果一个节点分裂XC,算法遍历两个子节点。每个子节点的权重变成父节点的值乘以与每个子节点对应的观测值的百分比。在完成树遍历之后,算法使用分配的权重计算加权平均值。

对于袋装树的集合,估计的部分依赖性是单个树的加权平均值的平均值。

算法

对于回归模型(RegressionMdl)和分类模型(ClassificationMdl),partialDependence使用一个预测预测反应或分数的函数。partialDependence选择适当的预测函数根据模型和运行预测使用默认设置。有关各预测功能,请参见预测函数在下面两个表。如果指定的模型是基于树的模型(不包括树的增强集合),那么partialDependence使用加权遍历算法代替预测函数。有关详细信息,请参见加权算法遍历

回归模型对象

模型类型 完整或紧凑回归模型对象 预测反应的功能
用于决策树集成的引导聚合 CompactTreeBagger 预测
用于决策树集成的引导聚合 TreeBagger 预测
回归模型集合 RegressionEnsembleRegressionBaggedEnsembleCompactRegressionEnsemble 预测
采用随机特征展开的高斯核回归模型 RegressionKernel 预测
高斯过程回归 RegressionGPCompactRegressionGP 预测
广义加性模型 RegressionGAMCompactRegressionGAM 预测
广义线性混合效应模型 GeneralizedLinearMixedModel 预测
广义线性模型 GeneralizedLinearModelCompactGeneralizedLinearModel 预测
线性混合效应模型 LinearMixedModel 预测
线性回归 LinearModelCompactLinearModel 预测
高维数据的线性回归 RegressionLinear 预测
神经网络回归模型 RegressionNeuralNetworkCompactRegressionNeuralNetwork 预测
非线性回归 NonLinearModel 预测
回归树 RegressionTreeCompactRegressionTree 预测
支持向量机 RegressionSVMCompactRegressionSVM 预测

分类模型对象

模型类型 完整或紧凑的分类模型对象 预测标签和分数的函数
判别分析分类器 ClassificationDiscriminantCompactClassificationDiscriminant 预测
支持向量机或其他分类器的多类模型 ClassificationECOCCompactClassificationECOC 预测
学习者集合进行分类 ClassificationEnsembleCompactClassificationEnsembleClassificationBaggedEnsemble 预测
基于随机特征展开的高斯核分类模型 ClassificationKernel 预测
广义加性模型 ClassificationGAMCompactClassificationGAM 预测
k最近的邻居模型 ClassificationKNN 预测
线性分类模型 ClassificationLinear 预测
朴素贝叶斯模型 ClassificationNaiveBayesCompactClassificationNaiveBayes 预测
神经网络分类器 ClassificationNeuralNetworkCompactClassificationNeuralNetwork 预测
单类和二元分类的支持向量机 ClassificationSVMCompactClassificationSVM 预测
用于多类分类的二叉决策树 ClassificationTreeCompactClassificationTree 预测
决策树的袋装集合 TreeBaggerCompactTreeBagger 预测

选择功能

参考文献

[1]弗里德曼,杰罗姆。H. <贪婪函数逼近:梯度提升机>。统计年鉴29日,没有。5(2001): 1189 - 1232。

[2]哈斯蒂,特雷弗,罗伯特·蒂布希拉尼,杰罗姆·弗里德曼。统计学习的要素。纽约,纽约:施普林格纽约,2009。

扩展功能

版本历史

介绍了R2020b

Baidu
map