主要内容

RegressionBaggedEnsemble

包:classreg.learning.regr
超类:RegressionEnsemble

通过重采样增长的回归集合

描述

RegressionBaggedEnsemble结合一组训练过的弱学习者模型和这些学习者训练过的数据。它可以通过聚合弱学习者的预测来预测新数据的集合响应。

建设

使用创建袋装回归集成对象fitrensemble.设置名称-值对参数“方法”fitrensemble“包”使用引导聚合(例如,随机森林)。

属性

BinEdges

数值预测器的Bin边,指定为的单元格数组p数值向量,p是预测器的数量。每个向量都包含数值预测器的bin边。类别预测器的单元格数组中的元素为空,因为软件不收纳类别预测器。

的情况下,软件才会收纳数字预测器“NumBins”在用树学习器训练模型时,将名称-值参数作为正整数标量。的BinEdges属性为空“NumBins”值为空(默认)。

您可以重新生成归档的预测器数据Xbinned通过使用BinEdges被训练模型的属性mdl

X = mdl.X;%预测数据Xbinned = 0 (size(X));边缘= mdl.BinEdges;查找已装箱预测器的索引。idxNumeric =找到(~ cellfun (@isempty边缘));if iscolumn(idxNumeric) idxNumeric = idxNumeric';end for j = idxNumeric x = x (:,j);如果x是表,则将x转换为数组。If istable(x) x = table2array(x);方法将x分组到箱子中离散化函数。xbinned =离散化(x,[无穷;边缘{};正]);Xbinned (:, j) = Xbinned;结束
Xbinned包含数值预测器的bin索引,范围从1到bin的数量。Xbinned类别预测器的值为0。如果X包含S,那么对应的Xbinned值是年代。

CategoricalPredictors

分类预测指标,指定为正整数的向量。CategoricalPredictors包含指示相应的预测器是分类的索引值。索引值在1和之间p,在那里p用于训练模型的预测器的数量。如果没有一个预测器是绝对的,则此属性为空([]).

CombineWeights

描述集合如何结合学习者预测的字符向量。

ExpandedPredictorNames

扩展的预测器名称,存储为字符向量的单元格数组。

如果模型对分类变量使用编码,则ExpandedPredictorNames包括描述展开变量的名称。否则,ExpandedPredictorNamesPredictorNames

FitInfo

适合信息的数字数组。的FitInfoDescription属性描述此数组的内容。

FitInfoDescription

描述字符向量的意义FitInfo数组中。

FResample

一个介于0而且1FResample训练数据的分数是多少fitrensemble在构建集合时,对每个弱学习者进行随机重采样。

HyperparameterOptimizationResults

超参数的交叉验证优化描述,存储为BayesianOptimization对象或超参数和关联值的表。非空的时OptimizeHyperparameters名称-值对在创建时非空。值取决于的设置HyperparameterOptimizationOptions创建时的名值对:

  • “bayesopt”(默认)-类的对象BayesianOptimization

  • “gridsearch”“randomsearch”-使用的超参数表,观测到的目标函数值(交叉验证损失),以及从最低(最好)到最高(最差)的观测值排名

LearnerNames

集合中具有弱学习者名称的字符向量单元数组。每个学习者的名字只出现一次。例如,如果你有100棵树的集合,LearnerNames{'树'}

方法

带有算法名称的字符向量fitrensemble用于训练合奏团。

ModelParameters

培训所用参数实体

NumObservations

包含训练数据中观察数的数值标量。

NumTrained

集合中受过训练的学习者的数量,一个正标量。

PredictorNames

预测变量名称的单元格数组,按它们出现的顺序排列X

ReasonForTermination

描述原因的字符向量fitrensemble不再把学习能力差的学生加到集体中。

正则化

的结果的一种结构规范方法。使用正则化缩小降低替换误差,缩小集合。

取代

布尔标志,指示该集合中较弱学习者的训练数据是否经过替换采样。取代真正的对于有替换的抽样,否则。

ResponseName

带有响应变量名称的字符向量Y

ResponseTransform

转换分数的函数句柄,或表示内置转换函数的字符向量。“没有”意味着没有转换;同样,“没有”意味着@ x (x)

添加或更改ResponseTransform函数使用点表示法:

ens.ResponseTransform = @函数

训练有素的

训练有素的学习者,一个单元阵列的紧凑回归模型。

TrainedWeights

集合分配给学习者的权重的数字向量。该集合通过聚合来自学习者的加权预测计算预测反应。

UseObsForLearner

大小的逻辑矩阵N——- - - - - -NumTrained,在那里N训练数据中的行数(观察值)是多少X,NumTrained是受过训练的弱学习者的数量。UseObsForLearner (I, J)真正的如果观察是用来训练学习者的J,是否则。

W

的比例权重,一个有长度的向量n的行数X.元素的总和W1

X

训练集合的预测值矩阵或表。每一列的X表示一个变量,每一行表示一个观察结果。

Y

具有相同行数的数值列向量X这训练了整个团队。中的每个条目Y对应行中的数据是否响应X

对象的功能

紧凑的 创建紧凑的回归集成
crossval 交叉验证合奏
cvshrink 交叉验证收缩(修剪)集合
收集 收集的属性统计和机器学习工具箱对象从GPU
石灰 局部可解释模型不可知解释(LIME)
损失 回归误差
oobLoss Out-of-bag回归误差
oobPermutedPredictorImportance 通过对随机森林的回归树的袋外预测器观测的排列估计预测器重要性
oobPredict 预测集合的外袋响应
partialDependence 计算部分依赖
plotPartialDependence 创建偏依赖图(PDP)和个体条件期望图(ICE)
预测 使用回归模型集合预测响应
predictorImportance 预测因子对回归集合重要性的估计
规范 找出最小化替换误差和惩罚项的权重
removeLearners 删除紧凑回归集合的成员
resubLoss 由再替换引起的回归误差
resubPredict 用置换法预测系综的响应
重新开始 恢复训练合奏
沙普利 沙普利值
缩小 修剪合奏

复制语义

价值。要了解值类如何影响复制操作,请参见复制对象

例子

全部折叠

加载carsmall数据集。考虑一个解释汽车燃油经济性的模型(英里/加仑)使用它的重量(重量)及汽缸数目(气缸).

负载carsmallX =[重量气缸];Y = MPG;

使用所有度量值训练100个回归树的袋装集合。

Mdl = fitrensemble (X, Y,“方法”“包”
Mdl = RegressionBaggedEnsemble ResponseName: 'Y' CategoricalPredictors: [] ResponseTransform: 'none' NumObservations: 94 numtraining: 100 Method: 'Bag' LearnerNames: {'Tree'} reasonforterminate: '完成所要求的训练周期数后正常终止。'FitInfo: [] FitInfoDescription: 'None' Regularization: [] FResample: 1 Replace: 1 UseObsForLearner: [94x100 logical] Properties, Methods

Mdl是一个RegressionBaggedEnsemble模型对象。

Mdl。训练有素的存储经过训练的紧凑回归树的100 × 1单元格向量的属性(CompactRegressionTree模型对象)组成集成。

绘制第一个训练的回归树的图。

视图(Mdl。训练有素的{1},“模式”“图”

{

默认情况下,fitrensemble树长得很深,用来装树。

估计样本内均方误差(MSE)。

L = resubLoss (Mdl)
L = 12.4048

提示

对于回归树的袋装集合,则训练有素的的属性实体的单元格向量ens.NumTrainedCompactRegressionTree模型对象。用于树的文本或图形显示t在单元格向量中,输入

视图(实体。训练有素的{t})

扩展功能

版本历史

介绍了R2011a

Baidu
map