主要内容

predictorImportance

预测因子对回归树重要性的估计

语法

小鬼= predictorImportance(树)

描述

小鬼= predictorImportance (计算预测器重要性的估计通过对每个预测器上的分割导致的均方误差的变化相加,并将总和除以分支节点的数量。

输入参数

由。创建的回归树fitrtree,或通过紧凑的方法。

输出参数

小鬼

中的预测符(列)的数量与元素数量相同的行向量.X.条目是预测器重要性的估计,与0代表尽可能小的重要性。

例子

全部展开

估计数据中所有预测变量的预测重要性。

加载carsmall数据集。

负载carsmall

为的生长一个回归树英里/加仑使用加速度气缸位移马力Model_Year,重量为预测因子。

X =[加速缸排量马力型号_年重量];树= fitrtree (X, MPG);

估计所有预测变量的预测重要性。

小鬼= predictorImportance(树)
小鬼=1×60.0647 0.1068 0.1155 0.1411 0.3348 2.6565

重量这是最后一个预测指标,它对里程的影响最大。对预测影响最小的预测器是第一个变量,即加速度

估计数据中所有变量的预测器重要性,以及回归树中包含代理分支的位置。

加载carsmall数据集。

负载carsmall

为的生长一个回归树英里/加仑使用加速度气缸位移马力Model_Year,重量为预测因子。指定以标识代理分割。

X =[加速缸排量马力型号_年重量];树= fitrtree (X,英里/加仑,“代孕”“上”);

估计所有预测变量的预测重要性。

小鬼= predictorImportance(树)
小鬼=1×61.0449 2.4560 2.5570 2.5788 2.0832 2.8938

比较小鬼结果是估计预测的重要性重量还是对里程影响最大,但是气缸是第四个最重要的预测因素。

加载carsmall数据集。考虑一个模型,它可以根据加速度、气缸数量、发动机排量、马力、制造商、型号年份和重量来预测汽车的平均燃油经济性。考虑气缸制造行业,Model_Year作为分类变量。

负载carsmall气缸=分类(缸);及时通知=分类(cellstr (Mfg));Model_Year =分类(Model_Year);X =表(加速、气缸、排量、马力、制造行业,...Model_Year、重量、MPG);

显示类别变量中表示的类别数。

numCylinders =元素个数(类别(气缸))
numCylinders = 3
numMfg =元素个数(类别(有限公司))
numMfg = 28
numModelYear =元素个数(类别(Model_Year))
numModelYear = 3

因为只有三个类别气缸而且Model_Year,标准CART,预测器拆分算法更喜欢拆分连续预测器而不是这两个变量。

使用整个数据集训练一个回归树。要生长无偏树,请指定用于分裂预测器的曲率测试的用法。由于数据中缺少值,请指定代理分割的用法。

Mdl = fitrtree (X,“英里”“PredictorSelection”“弯曲”“代孕”“上”);

通过将每个预测器上的分裂导致的风险变化相加,并将总和除以分支节点的数量,估计预测器重要性值。用条形图比较估算值。

小鬼= predictorImportance (Mdl);图;酒吧(imp);标题(的预测估计的重要性);ylabel (“估计”);包含(“预测”);甘氨胆酸h =;h.XTickLabel = Mdl.PredictorNames;h.XTickLabelRotation = 45;h.TickLabelInterpreter =“没有”

图中包含一个axes对象。标题为Predictor Importance Estimates的axes对象包含一个类型为bar的对象。

在这种情况下,位移是最重要的预测因素,其次是马力

更多关于

全部展开

扩展功能

Baidu
map