RegressionBaggedEnsemble

包:classreg.learning.regr
超类:RegressionEnsemble

通过重采样增长的回归集合

描述

RegressionBaggedEnsemble结合一组训练过的弱学习者模型和这些学习者训练过的数据。它可以通过聚合弱学习者的预测来预测新数据的集合响应。

建设

使用创建袋装回归集成对象fitrensemble．设置名称-值对参数“方法”的fitrensemble来“包”使用引导聚合(例如，随机森林)。

属性

`BinEdges`	数值预测器的Bin边，指定为的单元格数组p数值向量,p是预测器的数量。每个向量都包含数值预测器的bin边。类别预测器的单元格数组中的元素为空，因为软件不收纳类别预测器。的情况下，软件才会收纳数字预测器`“NumBins”`在用树学习器训练模型时，将名称-值参数作为正整数标量。的`BinEdges`属性为空`“NumBins”`值为空(默认)。您可以重新生成归档的预测器数据`Xbinned`通过使用`BinEdges`被训练模型的属性`mdl`． X = mdl.X;%预测数据Xbinned = 0 (size(X));边缘= mdl.BinEdges;查找已装箱预测器的索引。idxNumeric =找到(~ cellfun (@isempty边缘));if iscolumn(idxNumeric) idxNumeric = idxNumeric';end for j = idxNumeric x = x (:，j);如果x是表，则将x转换为数组。If istable(x) x = table2array(x);方法将x分组到箱子中`离散化`函数。xbinned =离散化(x,[无穷;边缘{};正]);Xbinned (:, j) = Xbinned;结束 `Xbinned`包含数值预测器的bin索引，范围从1到bin的数量。`Xbinned`类别预测器的值为0。如果`X`包含`南`S，那么对应的`Xbinned`值是`南`年代。
`CategoricalPredictors`	分类预测指标，指定为正整数的向量。`CategoricalPredictors`包含指示相应的预测器是分类的索引值。索引值在1和之间`p`,在那里`p`用于训练模型的预测器的数量。如果没有一个预测器是绝对的，则此属性为空(`［］`）.
`CombineWeights`	描述集合如何结合学习者预测的字符向量。
`ExpandedPredictorNames`	扩展的预测器名称，存储为字符向量的单元格数组。如果模型对分类变量使用编码，则`ExpandedPredictorNames`包括描述展开变量的名称。否则,`ExpandedPredictorNames`和`PredictorNames`．
`FitInfo`	适合信息的数字数组。的`FitInfoDescription`属性描述此数组的内容。
`FitInfoDescription`	描述字符向量的意义`FitInfo`数组中。
`FResample`	一个介于`0`而且`1`．`FResample`训练数据的分数是多少`fitrensemble`在构建集合时，对每个弱学习者进行随机重采样。
`HyperparameterOptimizationResults`	超参数的交叉验证优化描述，存储为`BayesianOptimization`对象或超参数和关联值的表。非空的时`OptimizeHyperparameters`名称-值对在创建时非空。值取决于的设置`HyperparameterOptimizationOptions`创建时的名值对: `“bayesopt”`(默认)-类的对象`BayesianOptimization` `“gridsearch”`或`“randomsearch”`-使用的超参数表，观测到的目标函数值(交叉验证损失)，以及从最低(最好)到最高(最差)的观测值排名
`LearnerNames`	集合中具有弱学习者名称的字符向量单元数组。每个学习者的名字只出现一次。例如，如果你有100棵树的集合，`LearnerNames`是`{'树'}`．
`方法`	带有算法名称的字符向量`fitrensemble`用于训练合奏团。
`ModelParameters`	培训所用参数`实体`．
`NumObservations`	包含训练数据中观察数的数值标量。
`NumTrained`	集合中受过训练的学习者的数量，一个正标量。
`PredictorNames`	预测变量名称的单元格数组，按它们出现的顺序排列`X`．
`ReasonForTermination`	描述原因的字符向量`fitrensemble`不再把学习能力差的学生加到集体中。
`正则化`	的结果的一种结构`规范`方法。使用`正则化`与`缩小`降低替换误差，缩小集合。
`取代`	布尔标志，指示该集合中较弱学习者的训练数据是否经过替换采样。`取代`是`真正的`对于有替换的抽样，`假`否则。
`ResponseName`	带有响应变量名称的字符向量`Y`．
`ResponseTransform`	转换分数的函数句柄，或表示内置转换函数的字符向量。`“没有”`意味着没有转换;同样,`“没有”`意味着`@ x (x)`．添加或更改`ResponseTransform`函数使用点表示法: ens.ResponseTransform = @函数
`训练有素的`	训练有素的学习者，一个单元阵列的紧凑回归模型。
`TrainedWeights`	集合分配给学习者的权重的数字向量。该集合通过聚合来自学习者的加权预测计算预测反应。
`UseObsForLearner`	大小的逻辑矩阵`N`——- - - - - -`NumTrained`,在那里`N`训练数据中的行数(观察值)是多少`X`,`NumTrained`是受过训练的弱学习者的数量。`UseObsForLearner (I, J)`是`真正的`如果观察`我`是用来训练学习者的`J`,是`假`否则。
`W`	的比例`权重`，一个有长度的向量`n`的行数`X`．元素的总和`W`是`1`．
`X`	训练集合的预测值矩阵或表。每一列的`X`表示一个变量，每一行表示一个观察结果。
`Y`	具有相同行数的数值列向量`X`这训练了整个团队。中的每个条目`Y`对应行中的数据是否响应`X`．

对象的功能

`紧凑的`	创建紧凑的回归集成
`crossval`	交叉验证合奏
`cvshrink`	交叉验证收缩(修剪)集合
`收集`	收集的属性统计和机器学习工具箱对象从GPU
`石灰`	局部可解释模型不可知解释(LIME)
`损失`	回归误差
`oobLoss`	Out-of-bag回归误差
`oobPermutedPredictorImportance`	通过对随机森林的回归树的袋外预测器观测的排列估计预测器重要性
`oobPredict`	预测集合的外袋响应
`partialDependence`	计算部分依赖
`plotPartialDependence`	创建偏依赖图(PDP)和个体条件期望图(ICE)
`预测`	使用回归模型集合预测响应
`predictorImportance`	预测因子对回归集合重要性的估计
`规范`	找出最小化替换误差和惩罚项的权重
`removeLearners`	删除紧凑回归集合的成员
`resubLoss`	由再替换引起的回归误差
`resubPredict`	用置换法预测系综的响应
`重新开始`	恢复训练合奏
`沙普利`	沙普利值
`缩小`	修剪合奏

复制语义

价值。要了解值类如何影响复制操作，请参见复制对象．

例子

全部折叠

训练回归树的袋装集合

打开生活的脚本

加载carsmall数据集。考虑一个解释汽车燃油经济性的模型(英里/加仑)使用它的重量(重量)及汽缸数目(气缸）.

负载carsmallX =[重量气缸];Y = MPG;

使用所有度量值训练100个回归树的袋装集合。

Mdl = fitrensemble (X, Y,“方法”，“包”）

Mdl = RegressionBaggedEnsemble ResponseName: 'Y' CategoricalPredictors: [] ResponseTransform: 'none' NumObservations: 94 numtraining: 100 Method: 'Bag' LearnerNames: {'Tree'} reasonforterminate: '完成所要求的训练周期数后正常终止。'FitInfo: [] FitInfoDescription: 'None' Regularization: [] FResample: 1 Replace: 1 UseObsForLearner: [94x100 logical] Properties, Methods

Mdl是一个RegressionBaggedEnsemble模型对象。

Mdl。训练有素的存储经过训练的紧凑回归树的100 × 1单元格向量的属性(CompactRegressionTree模型对象)组成集成。

绘制第一个训练的回归树的图。

视图(Mdl。训练有素的{1},“模式”，“图”）

默认情况下,fitrensemble树长得很深，用来装树。

估计样本内均方误差(MSE)。

L = resubLoss (Mdl)

L = 12.4048

提示

对于回归树的袋装集合，则训练有素的的属性实体的单元格向量ens.NumTrainedCompactRegressionTree模型对象。用于树的文本或图形显示t在单元格向量中，输入

视图(实体。训练有素的{t})

扩展功能

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用注意事项和限制:

的预测函数支持代码生成。
将集合的预测集成到Simulink中^®，你可以使用RegressionEnsemble预测在统计和机器学习工具箱™库或MATLAB中^®函数块中包含预测函数。
当你用fitrensemble，回归树的代码生成限制也适用于回归树的集合。有关更多细节，请参见代码生成的CompactRegressionTree类。