CompactRegressionTree

包:classreg.learning.regr

紧致回归树

展开全部页面

描述

回归树(类的)的压缩版本RegressionTree)．精简版不包括训练回归树的数据。因此，您不能使用紧凑的回归树执行某些任务，例如交叉验证。使用紧凑的回归树对新数据进行预测(回归)。

建设

ctree=紧凑(树）从完整决策树构造紧凑决策树。

输入参数

全部展开

`树`- - - - - -完整的训练过的回归树
`RegressionTree`对象

完整的训练过的回归树，指定为RegressionTree构造的对象fitrtree．

属性

`CategoricalPredictors`	分类预测指标，指定为正整数向量。`CategoricalPredictors`包含指示相应预测符是分类的索引值。索引值在1和之间`p`,在那里`p`用于训练模型的预测器的数量。如果没有一个预测符是分类的，则此属性为空(`［］`)．
`CategoricalSplit`	一个n-by-2单元格数组，其中`n`分类分割的数量是多少`树`．每一行`CategoricalSplit`给出分类分割的左右值。对每个分支节点进行分类分割`j`基于分类预测变量`z`，则左子元素被选中`z`是在`CategoricalSplit (j, 1)`如果`z`是在`CategoricalSplit (j, 2)`．分割的顺序与树节点的顺序相同。可以通过运行来找到这些分割的节点`cuttype`并选择`“分类”`从上到下切。
`孩子们`	一个n中每个节点的子节点的编号`树`,在那里n为节点数。叶子节点有子节点`0`．
`CutCategories`	一个n中分支使用的类别的-by-2单元数组`树`,在那里n为节点数。对于每个分支节点`我`基于分类预测变量`x`，则左子元素被选中`x`所列的类别中`CutCategories{1},我`，则选择正确的子节点`x`是在`CutCategories{2},我`．两列`CutCategories`对于基于连续预测器的分支节点和叶节点，为空。 `割点`包含的切点`“连续”`削减,`CutCategories`包含类别集。
`割点`	一个n-元素向量的值用作切割点`树`,在那里n为节点数。对于每个分支节点`我`基于一个连续的预测变量`x`，则左子元素被选中`割点< v(我)`如果`x > =割点(我)`．`割点`是`南`对于基于分类预测器的分支节点和叶节点。
`CutType`	一个n元素单元格数组，表示在每个节点上的切割类型`树`,在那里n为节点数。对于每个节点`我`，`CutType{我}`是: `“连续”`—如果在表单中定义了切割`X < v`对于一个变量`x`切割点`v`． `“分类”`—若切定义为是否变量`x`获取一组类别中的值。 `”`——如果`我`是叶节点。 `割点`包含的切点`“连续”`削减,`CutCategories`包含类别集。
`CutPredictor`	一个n中每个节点中用于分支的变量名称的单元格数组`树`,在那里n为节点数。这些变量有时被称为减少变量．对于叶节点，`CutPredictor`包含一个空字符向量。 `割点`包含的切点`“连续”`削减,`CutCategories`包含类别集。
`CutPredictorIndex`	一个n用于分支的每个节点的变量的数值索引数组`树`,在那里n为节点数。有关更多信息，请参见`CutPredictor`．
`ExpandedPredictorNames`	扩展的预测器名称，存储为字符向量的单元格数组。如果模型对分类变量使用编码，则`ExpandedPredictorNames`包括描述展开变量的名称。否则,`ExpandedPredictorNames`和`PredictorNames`．
`IsBranchNode`	一个n-元素逻辑向量`ib`这是`真正的`对于每个分支节点和`假`的每个叶节点`树`．
`NodeError`	一个n元向量`e`节点的误差`树`,在那里n为节点数。`e(我)`节点的错分类概率是多少`我`．
`NodeMean`	一个n的每个节点中都有平均值的element数值数组`树`,在那里n是树中的节点数。每一个元素`NodeMean`平均值是真的吗`Y`节点中所有观测值的值。
`NodeProbability`	一个n元向量`p`节点的概率`树`,在那里n为节点数。一个节点的概率是通过原始数据中满足该节点条件的观测值的比例来计算的。这个比例根据分配给每个类的任何先验概率进行调整。
`NodeRisk`	一个n-树中节点风险的element向量，其中n为节点数。每个节点的风险是由节点误差加权的节点概率。
`NodeSize`	一个n元向量`大小`节点的大小`树`,在那里n为节点数。节点的大小定义为用于创建满足节点条件的树的数据的观察数。
`NumNodes`	节点数量`n`在`树`．
`父`	一个n元向量`p`中每个节点的父节点号`树`,在那里n为节点数。根节点的父节点为`0`．
`PredictorNames`	预测变量名称的单元格数组，按它们出现的顺序排列`X`．
`PruneAlpha`	数字向量，每个修剪级别有一个元素。如果修剪级别为0 ~米,然后`PruneAlpha`有米+ 1个元素按升序排序。`PruneAlpha (1)`用于0级修剪(不修剪)，`PruneAlpha (2)`用于修剪级别1，依此类推。
`PruneList`	一个n的每个节点的剪枝级别`树`,在那里n为节点数。修剪级别从0(不修剪)到米,在那里米最深的叶节点和根节点之间的距离。
`ResponseName`	响应变量的名称`Y`，一个字符向量。
`ResponseTransform`	转换原始响应值(均方误差)的函数句柄。函数句柄必须接受一个响应值矩阵并返回一个相同大小的矩阵。默认的`“没有”`意味着`@ x (x)`，或者没有变换。添加或更改`ResponseTransform`函数使用点表示法: ctree。ResponseTransform = @函数
`SurrogateCutCategories`	一个n用于代理分割的类别的element单元格数组`树`,在那里n节点个数是否到位`树`．对于每个节点`k`，`SurrogateCutCategories {k}`是单元格数组。的长度`SurrogateCutCategories {k}`等于在此节点上找到的代理预测器的数量。每一个元素`SurrogateCutCategories {k}`是连续代理预测器的空字符向量，还是类别代理预测器的包含类别的两元素单元格数组。这个两元素单元格数组的第一个元素列出了由代理分裂分配给左子元素的类别，这个两元素单元格数组的第二个元素列出了由代理分裂分配给右子元素的类别。每个节点上的代理拆分变量的顺序与节点中的变量的顺序匹配`SurrogateCutPredictor`．此节点上的最佳分割变量不会出现。对于非分支(叶)节点，`SurrogateCutCategories`包含一个空单元格。
`SurrogateCutFlip`	一个n用于代理分割的数值切割分配的单元格数组`树`,在那里n节点个数是否到位`树`．对于每个节点`k`，`SurrogateCutFlip {k}`是数值向量。的长度`SurrogateCutFlip {k}`等于在此节点上找到的代理预测器的数量。每一个元素`SurrogateCutFlip {k}`对于分类代理预测器为0，对于连续代理预测器为数值切割赋值。数值切割分配可以是-1或+1。每个代理都有一个数字分割C基于一个连续的预测变量Z，则左子元素被选中Z<C这个代理分割的切割分配是+1，或者Z≥C这个代理分割的切割值是-1。类似地，如果Z≥C这个代理分割的切割分配是+1，或者Z<C这个代理分割的切割值是-1。每个节点上的代理拆分变量的顺序与节点中的变量的顺序匹配`SurrogateCutPredictor`．此节点上的最佳分割变量不会出现。对于非分支(叶)节点，`SurrogateCutFlip`包含一个空数组。
`SurrogateCutPoint`	一个n用于代理分割的数值的单元格数组`树`,在那里n节点个数是否到位`树`．对于每个节点`k`，`SurrogateCutPoint {k}`是数值向量。的长度`SurrogateCutPoint {k}`等于在此节点上找到的代理预测器的数量。每一个元素`SurrogateCutPoint {k}`要么是`南`对于分类替代预测器，或连续替代预测器的数字切割。每个代理都有一个数字分割C基于一个连续的预测变量Z，则左子元素被选中Z<C而且`SurrogateCutFlip`对于这个代理拆分为+1，或者ifZ≥C而且`SurrogateCutFlip`这个代理的分割是-1。类似地，如果Z≥C而且`SurrogateCutFlip`对于这个代理拆分为+1，或者ifZ<C而且`SurrogateCutFlip`这个代理的分割是-1。在每个节点上的代理拆分变量的顺序与返回的变量的顺序相匹配`SurrogateCutVar`．此节点上的最佳分割变量不会出现。对于非分支(叶)节点，`SurrogateCutPoint`包含一个空单元格。
`SurrogateCutType`	一个n中每个节点上的代理拆分类型的单元格数组`树`,在那里n节点个数是否到位`树`．对于每个节点`k`，`SurrogateCutType {k}`是一个单元格数组，其中包含此节点上的代理程序拆分变量的类型。变量按照与最优预测因子关联的预测测度排序，按降序排列，仅包含具有正预测测度的变量。每个节点上的代理拆分变量的顺序与节点中的变量的顺序匹配`SurrogateCutPredictor`．此节点上的最佳分割变量不会出现。对于非分支(叶)节点，`SurrogateCutType`包含一个空单元格。代理拆分类型可以是任意一种`“连续”`如果在窗体中定义了切割`Z`<`V`对于一个变量`Z`切割点`V`或`“分类”`是否切割定义为是否`Z`获取一组类别中的值。
`SurrogateCutPredictor`	一个n中每个节点中用于代理分割的变量名称的单元格数组`树`,在那里n节点个数是否到位`树`．每一个元素`SurrogateCutPredictor`具有此节点上的代理程序拆分变量名称的单元格数组。变量按照与最优预测因子关联的预测测度排序，按降序排列，仅包含具有正预测测度的变量。此节点上的最佳分割变量不会出现。对于非分支(叶)节点，`SurrogateCutPredictor`包含一个空单元格。
`SurrogatePredictorAssociation`	一个n-元单元阵列的关联预测措施的代理分裂在`树`,在那里n节点个数是否到位`树`．对于每个节点`k`，`SurrogatePredictorAssociation {k}`是数值向量。的长度`SurrogatePredictorAssociation {k}`等于在此节点上找到的代理预测器的数量。每一个元素`SurrogatePredictorAssociation {k}`给出了最佳分割和代理分割之间关联的预测度量。每个节点上的代理拆分变量的顺序就是其中变量的顺序`SurrogateCutPredictor`．此节点上的最佳分割变量不会出现。对于非分支(叶)节点，`SurrogatePredictorAssociation`包含一个空单元格。

对象的功能

`收集`	收集属性统计和机器学习工具箱来自GPU的对象
`石灰`	局部可解释模型不可知解释(LIME)
`损失`	回归误差
`nodeVariableRange`	检索决策树节点的可变范围
`partialDependence`	计算部分依赖关系
`plotPartialDependence`	创建部分依赖图(PDP)和个别条件期望图(ICE)
`预测`	使用回归树预测响应
`predictorImportance`	回归树预测因子重要性的估计
`沙普利`	沙普利值
`surrogateAssociation`	回归树中代理分裂关联的平均预测度量
`更新`	更新用于代码生成的模型参数
`视图`	视图回归树

复制语义

价值。要了解值类如何影响复制操作，请参见复制对象．

例子

全部折叠

构造并压缩回归树

打开实时脚本

加载样例数据。

负载carsmall

为样本数据构造一个回归树。

tree = fitrtree([重量，气缸]，MPG，.．.“MinParentSize”, 20岁,.．.“PredictorNames”, {' W '，“C”})；

制作一个紧凑版本的树。

Ctree = compact(树);

将紧凑树的大小与完整树的大小进行比较。

T = who (“树”）;% t.bytes =树大小(以字节为单位)C = whos(“ctree”）;% c.bytes = ctree的大小，单位为字节[c。字节t.bytes]

ans =1×24311 7558

紧凑树比完整树小。

扩展功能

C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用注意事项和限制:

的预测而且更新函数支持代码生成。
将回归树模型的预测集成到Simulink中^®，你可以使用RegressionTree预测块的统计和机器学习工具箱™库或MATLAB^®函数块。预测函数。
训练回归树模型时使用fitrtree，则适用以下限制。
- 的值“ResponseTransform”名称-值对参数必须为“没有”(默认)。
- 您不能使用代理分割，即“代孕”名称-值对参数必须为“关闭”．
- 定点代码生成和使用编码器配置器的代码生成不支持分类预测器(逻辑，分类，字符，字符串,或细胞)．您不能使用“CategoricalPredictors”名称-值参数。若要在模型中包含分类预测器，请使用dummyvar在拟合模型之前。

有关更多信息，请参见代码生成简介．

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

使用注意事项和限制:

以下对象函数完全支持GPU阵列:
以下对象函数对GPU阵列提供有限的支持:
对象函数在GPU上执行，前提是满足以下条件:
- 该模型采用GPU阵列进行拟合。
- 传递给对象函数的预测器数据是一个GPU数组。
- 传递给对象函数的响应数据是一个GPU数组。

有关更多信息，请参见在图形处理器上运行MATLAB函数(并行计算工具箱)．

版本历史

在R2011a中引入

另请参阅

fitrtree|RegressionTree|紧凑的