CompactClassificationTree

包:classreg.learning.classif

紧凑的分类树

描述

分类树的精简版本ClassificationTree)．精简版本不包括训练分类树的数据。因此，您不能使用紧凑的分类树执行某些任务，例如交叉验证。使用紧凑的分类树对新数据进行预测(分类)。

建设

ctree=紧凑(树）从一个完整的决策树构造一个紧凑的决策树。

输入参数

`树`	一个使用`fitctree`．

属性

`CategoricalPredictors`	分类预测指标，指定为正整数的向量。`CategoricalPredictors`包含指示相应的预测器是分类的索引值。索引值在1和之间`p`,在那里`p`用于训练模型的预测器的数量。如果没有一个预测器是绝对的，则此属性为空(`［］`)．
`CategoricalSplit`	一个n-by-2 cell array，其中`n`分类分裂的数量在吗`树`．在每一行`CategoricalSplit`为分类拆分提供左值和右值。对每个分支节点进行分类拆分`j`基于一个分类预测变量`z`，则选择左子结点`z`是在`CategoricalSplit (j, 1)`如果选择了正确的子结点`z`是在`CategoricalSplit (j, 2)`．拆分的顺序与树节点的顺序相同。通过运行可以找到这些分割的节点`cuttype`并选择`“分类”`从上到下切。
`孩子们`	一个n-by-2数组，其中每个节点的子节点编号`树`,在那里n是节点数。叶节点有子节点`0`．
`ClassCount`	一个n——- - - - - -k中的节点的类计数数组`树`,在那里n节点数和k是类的数量。对于任意节点号`我`，班级算`ClassCount(我,:)`每个类的观察计数(来自于拟合树所用的数据)是否满足节点的条件`我`．
`一会`	中的元素列表`Y`删除重复的。`一会`可以是数字向量、类别变量向量、逻辑向量、字符数组或字符向量的单元格数组。`一会`是否与实参中的数据类型相同`Y`．(该软件将字符串数组视为字符向量的单元格数组。) 如果属性的值至少有一个长度维度k,然后`一会`指示元素沿该维度的顺序(例如，`成本`而且`之前`)．
`ClassProbability`	一个n——- - - - - -k中的节点的类概率数组`树`,在那里n节点数和k是类的数量。对于任意节点号`我`，类概率`ClassProbability(我,:)`一个点的每个类的估计概率满足节点的条件吗`我`．
`成本`	方阵,`成本(i, j)`将一个点分类到类的成本是多少`j`如果它真正的阶级是`我`(行对应真正的类，列对应预测的类)。的行和列的顺序`成本`中的类的顺序`一会`．中的行数和列数`成本`是响应中惟一类的数量。此属性是只读的。
`CutCategories`	一个n中分支使用的类别的-by-2 cell数组`树`,在那里n是节点数。对于每个分支节点`我`基于一个分类预测变量`x`，则选择左子结点`x`是在类别中列出的`CutCategories{1},我`，则选择正确的子结点`x`列在`CutCategories{2},我`．这两列的`CutCategories`对于基于连续预测器的分支节点和叶节点，为空。 `割点`的切点`“连续”`削减,`CutCategories`包含类别集。
`割点`	一个n中用作切点的值的元素向量`树`,在那里n是节点数。对于每个分支节点`我`基于连续预测变量`x`，则选择左子结点`x <割点(我)`如果选择了正确的子结点`x > =割点(我)`．`割点`是`南`对于基于分类预测器的分支节点和叶节点。 `割点`的切点`“连续”`削减,`CutCategories`包含类别集。
`CutType`	一个n-element单元格数组，表示在每个节点上的切割类型`树`,在那里n是节点数。为每个节点`我`，`CutType{我}`是: `“连续”`-如果切割在表格中有定义`x < v`为一个变量`x`和减少点`v`． `“分类”`-如果切割被定义为是否一个变量`x`接受一组类别中的值。 `”`——如果`我`是叶节点。 `割点`的切点`“连续”`削减,`CutCategories`包含类别集。
`CutPredictor`	一个n用于在每个节点中分支的变量名称的单元格数组`树`,在那里n是节点数。这些变量有时被称为减少变量．叶节点,`CutPredictor`包含一个空的字符向量。 `割点`的切点`“连续”`削减,`CutCategories`包含类别集。
`CutPredictorIndex`	一个n用于在每个节点中分支的变量的数值索引数组`树`,在那里n是节点数。有关更多信息，请参见`CutPredictor`．
`ExpandedPredictorNames`	扩展的预测器名称，存储为字符向量的单元格数组。如果模型对分类变量使用编码，则`ExpandedPredictorNames`包括描述展开变量的名称。否则,`ExpandedPredictorNames`和`PredictorNames`．
`IsBranchNode`	一个n-元素逻辑向量即`真正的`对于每个分支节点和`假`的每个叶节点`树`．
`NodeClass`	一个n的每个节点中最可能的类的名称`树`,在那里n是树中的节点数。数组中的每个元素都是一个字符向量，等于其中一个类名`一会`．
`NodeError`	一个n中的节点误差的-element向量`树`,在那里n是节点数。`NodeError(我)`节点的错误分类概率是多少`我`．
`NodeProbability`	一个n中的节点概率的-元素向量`树`,在那里n是节点数。一个节点的概率计算为原始数据中满足该节点条件的观测值的比例。这个比例根据分配给每个类别的任何先验概率进行调整。
`NodeRisk`	一个n树中节点风险的-元素向量，其中n是节点数。每个节点的风险是该节点通过节点概率加权的杂质(基尼指数或偏差)的度量。如果树是两倍生长的，那么每个节点的风险为零。
`NodeSize`	一个n中的节点大小的-element向量`树`,在那里n是节点数。节点的大小定义为用于创建满足节点条件的树的数据的观察数。
`NumNodes`	中的节点数`树`．
`父`	一个n中每个节点的父节点编号`树`,在那里n是节点数。根节点的父节点为`0`．
`PredictorNames`	预测变量名称的单元格数组，按它们出现的顺序排列`X`．
`之前`	每种类别的先验概率的数字向量。元素的顺序`之前`中的类的顺序`一会`．元素的个数`之前`是响应中惟一类的数量。此属性是只读的。
`PruneAlpha`	每个修剪级别有一个元素的数字向量。如果修剪级别在0 ~米,然后`PruneAlpha`有米+ 1个元素按升序排序。`PruneAlpha (1)`为修剪级别0(不修剪)，`PruneAlpha (2)`用于修剪级别1，以此类推。
`PruneList`	一个n的每个节点的剪枝级别为的-元素数值向量`树`,在那里n是节点数。修剪级别从0(不修剪)到米,在那里米最深叶和根节点之间的距离。
`ResponseName`	描述响应变量的字符向量`Y`．
`ScoreTransform`	转换分数的函数句柄，或表示内置转换函数的字符向量。`“没有”`意味着没有转换;同样,`“没有”`意味着`@ x (x)`．有关内置转换函数的列表和自定义转换函数的语法，请参见`fitctree`．添加或更改`ScoreTransform`函数使用点表示法: ctree。ScoreTransform = '函数”或ctree。ScoreTransform = @函数
`SurrogateCutCategories`	一个n中用于代理拆分的类别的-element单元格数组`树`,在那里n节点数在吗`树`．为每个节点`k`，`SurrogateCutCategories {k}`是单元格数组。的长度`SurrogateCutCategories {k}`等于在此节点上找到的代理预测器的数量。每个元素的`SurrogateCutCategories {k}`是连续代理预测器的空字符向量，或者是类别代理预测器的带类别的双元素单元格数组。这个双元素单元格数组的第一个元素列出由这个代理拆分分配给左子元素的类别，这个双元素单元格数组的第二个元素列出由这个代理拆分分配给右子元素的类别。每个节点上的代理拆分变量的顺序与其中变量的顺序相匹配`SurrogateCutVar`．此节点上的最佳分割变量不会出现。对于非分枝(叶)节点，`SurrogateCutCategories`包含一个空单元格。
`SurrogateCutFlip`	一个n用于代理分割的数值切割分配的单元格数组`树`,在那里n节点数在吗`树`．为每个节点`k`，`SurrSurrogateCutFlip {k}`是一个数字向量。的长度`SurrogateCutFlip {k}`等于在此节点上找到的代理预测器的数量。每个元素的`SurrogateCutFlip {k}`对于类别代理预测器是零，对于连续代理预测器是数值切割赋值。数字切割分配可以是-1或+1。对于每一个用数字切割的代理分割C基于连续预测变量Z，则选择左子结点Z<C这个代理分割的切割分配是+1，或者Z≥C代理分割的切割分配是-1。类似地，如果选择正确的子结点Z≥C这个代理分割的切割分配是+1，或者Z<C代理分割的切割分配是-1。每个节点上的代理拆分变量的顺序与其中变量的顺序相匹配`SurrogateCutPredictor`．此节点上的最佳分割变量不会出现。对于非分枝(叶)节点，`SurrogateCutFlip`包含一个空数组。
`SurrogateCutPoint`	一个n中用于代理分割的数值的单元格数组`树`,在那里n节点数在吗`树`．为每个节点`k`，`SurrogateCutPoint {k}`是一个数字向量。的长度`SurrogateCutPoint {k}`等于在此节点上找到的代理预测器的数量。每个元素的`SurrogateCutPoint {k}`要么是`南`对于类别替代预测器，或连续替代预测器的数字切割。对于每一个用数字切割的代理分割C基于连续预测变量Z，则选择左子结点Z<C而且`SurrogateCutFlip`对于这个代理程序拆分为+1，或者ifZ≥C而且`SurrogateCutFlip`对于这个代理程序的分割是-1。类似地，如果选择正确的子结点Z≥C而且`SurrogateCutFlip`对于这个代理程序拆分为+1，或者ifZ<C而且`SurrogateCutFlip`对于这个代理程序的分割是-1。在每个节点上的代理拆分变量的顺序与返回的变量的顺序相匹配`SurrogateCutPredictor`．此节点上的最佳分割变量不会出现。对于非分枝(叶)节点，`SurrogateCutPoint`包含一个空单元格。
`SurrogateCutType`	一个n-element单元格数组，指示在中的每个节点上代理拆分的类型`树`,在那里n节点数在吗`树`．为每个节点`k`，`SurrogateCutType {k}`是一个单元格数组，其中包含此节点上的代理拆分变量的类型。变量按与最优预测因子关联的预测测度按降序排序，只有预测测度为正的变量被包括在内。每个节点上的代理拆分变量的顺序与其中变量的顺序相匹配`SurrogateCutPredictor`．此节点上的最佳分割变量不会出现。对于非分枝(叶)节点，`SurrogateCutType`包含一个空单元格。代理分离类型可以是其中之一`“连续”`如果切割是定义在形式`Z`<`V`为一个变量`Z`和减少点`V`或`“分类”`如果切割是由是否`Z`接受一组类别中的值。
`SurrogateCutPredictor`	一个n中的每个节点中用于代理拆分的变量名称的-element单元格数组`树`,在那里n节点数在吗`树`．每个元素的`SurrogateCutPredictor`是一个单元格数组，其中包含此节点上的代理拆分变量的名称。变量按与最优预测因子关联的预测测度按降序排序，只有预测测度为正的变量被包括在内。此节点上的最佳分割变量不会出现。对于非分枝(叶)节点，`SurrogateCutPredictor`包含一个空单元格。
`SurrogatePredictorAssociation`	一个n中代理分裂的关联预测度量的-元素单元数组`树`,在那里n节点数在吗`树`．为每个节点`k`，`SurrogatePredictorAssociation {k}`是一个数字向量。的长度`SurrogatePredictorAssociation {k}`等于在此节点上找到的代理预测器的数量。每个元素的`SurrogatePredictorAssociation {k}`给出了最佳分割和代理分割之间关联的预测度量。代理拆分变量在每个节点上的顺序与其中变量的顺序相同`SurrogateCutPredictor`．此节点上的最佳分割变量不会出现。对于非分枝(叶)节点，`SurrogatePredictorAssociation`包含一个空单元格。

对象的功能

`compareHoldout`	使用新数据比较两种分类模型的准确性
`边缘`	分类的优势
`收集`	收集的属性统计和机器学习工具箱对象从GPU
`石灰`	局部可解释模型不可知解释(LIME)
`损失`	分类错误
`保证金`	分类的利润率
`nodeVariableRange`	检索决策树节点的变量范围
`partialDependence`	计算部分依赖
`plotPartialDependence`	创建偏依赖图(PDP)和个体条件期望图(ICE)
`预测`	使用分类树预测标签
`predictorImportance`	预测因子对分类树重要性的估计
`沙普利`	沙普利值
`surrogateAssociation`	分类树中代理分叉关联的平均预测测度
`更新`	更新模型参数以生成代码
`视图`	视图分类树

复制语义

价值。要了解值类如何影响复制操作，请参见复制对象．

例子

全部折叠

构建一个紧凑的分类树

打开生活的脚本

为Fisher虹膜数据构建一个紧凑的分类树。

负载fisheriris树= fitctree(量、种类);ctree =紧凑(树);

将结果树的大小与原始树的大小进行比较。

t =谁(“树”）;% t.bytes =以字节为单位的树大小c =谁(“ctree”）;% c.bytes = ctree的大小，单位为字节[c。字节t.bytes]

ans =1×25097 11762

紧凑型树比原始树小。

扩展功能

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用注意事项和限制:

的预测而且更新函数支持代码生成。
将分类树模型的预测集成到Simulink中^®，你可以使用ClassificationTree预测在统计和机器学习工具箱™库或MATLAB中^®函数块中包含预测函数。
训练分类树时使用fitctree，适用以下限制。
- 的值“ScoreTransform”名值对参数不能是匿名函数。对于定点代码生成，可以使用“ScoreTransform”值不能“invlogit”．
- 的值不能使用代理分割“代孕”名称-值对参数必须为“关闭”．
- 对于定点代码生成和使用编码器配置程序的代码生成，适用以下附加限制。
  - 分类预测(逻辑，分类，字符，字符串,或细胞)。您不能使用CategoricalPredictors名称-值参数。要在模型中包含类别预测器，可以使用dummyvar在拟合模型之前。
  - 类的标签，使用分类不支持数据类型。训练数据中的类标签值(资源描述或Y的值一会类的名称-值参数不能是数组分类数据类型。

有关更多信息，请参见代码生成简介．

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

使用注意事项和限制:

以下对象函数完全支持GPU阵列:
以下对象函数为GPU阵列提供了有限的支持:
如果适用以下任何一种情况，对象函数将在GPU上执行:
- 模型采用GPU阵列进行拟合。
- 传递给对象函数的预测器数据是一个GPU数组。

有关更多信息，请参见在图形处理器上运行MATLAB函数(并行计算工具箱)．

版本历史

介绍了R2011a

另请参阅

ClassificationTree|fitctree|紧凑的|compareHoldout

CompactClassificationTree

描述

建设

输入参数

属性

对象的功能

复制语义

例子

构建一个紧凑的分类树

更多关于

杂质和节点错误

扩展功能

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

版本历史

另请参阅

CompactClassificationTree

描述

建设

输入参数

属性

对象的功能

复制语义

例子

构建一个紧凑的分类树

更多关于

杂质和节点错误

扩展功能

C / c++代码生成使用MATLAB®Coder™生成C和c++代码。

GPU数组通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

版本历史

另请参阅

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。