帮助中心帮助中心
预测因子对回归树重要性的估计
小鬼= predictorImportance(树)
小鬼= predictorImportance (树)计算预测器重要性的估计树通过对每个预测器上的分割导致的均方误差的变化相加,并将总和除以分支节点的数量。
小鬼= predictorImportance (树)
小鬼
树
由。创建的回归树fitrtree,或通过紧凑的方法。
fitrtree
紧凑的
中的预测符(列)的数量与元素数量相同的行向量树.X.条目是预测器重要性的估计,与0代表尽可能小的重要性。
.X
0
全部展开
估计数据中所有预测变量的预测重要性。
加载carsmall数据集。
carsmall
负载carsmall
为的生长一个回归树英里/加仑使用加速度,气缸,位移,马力,Model_Year,重量为预测因子。
英里/加仑
加速度
气缸
位移
马力
Model_Year
重量
X =[加速缸排量马力型号_年重量];树= fitrtree (X, MPG);
估计所有预测变量的预测重要性。
小鬼=1×60.0647 0.1068 0.1155 0.1411 0.3348 2.6565
重量这是最后一个预测指标,它对里程的影响最大。对预测影响最小的预测器是第一个变量,即加速度.
估计数据中所有变量的预测器重要性,以及回归树中包含代理分支的位置。
为的生长一个回归树英里/加仑使用加速度,气缸,位移,马力,Model_Year,重量为预测因子。指定以标识代理分割。
X =[加速缸排量马力型号_年重量];树= fitrtree (X,英里/加仑,“代孕”,“上”);
小鬼=1×61.0449 2.4560 2.5570 2.5788 2.0832 2.8938
比较小鬼结果是估计预测的重要性,重量还是对里程影响最大,但是气缸是第四个最重要的预测因素。
加载carsmall数据集。考虑一个模型,它可以根据加速度、气缸数量、发动机排量、马力、制造商、型号年份和重量来预测汽车的平均燃油经济性。考虑气缸,制造行业,Model_Year作为分类变量。
制造行业
负载carsmall气缸=分类(缸);及时通知=分类(cellstr (Mfg));Model_Year =分类(Model_Year);X =表(加速、气缸、排量、马力、制造行业,...Model_Year、重量、MPG);
显示类别变量中表示的类别数。
numCylinders =元素个数(类别(气缸))
numCylinders = 3
numMfg =元素个数(类别(有限公司))
numMfg = 28
numModelYear =元素个数(类别(Model_Year))
numModelYear = 3
因为只有三个类别气缸而且Model_Year,标准CART,预测器拆分算法更喜欢拆分连续预测器而不是这两个变量。
使用整个数据集训练一个回归树。要生长无偏树,请指定用于分裂预测器的曲率测试的用法。由于数据中缺少值,请指定代理分割的用法。
Mdl = fitrtree (X,“英里”,“PredictorSelection”,“弯曲”,“代孕”,“上”);
通过将每个预测器上的分裂导致的风险变化相加,并将总和除以分支节点的数量,估计预测器重要性值。用条形图比较估算值。
小鬼= predictorImportance (Mdl);图;酒吧(imp);标题(的预测估计的重要性);ylabel (“估计”);包含(“预测”);甘氨胆酸h =;h.XTickLabel = Mdl.PredictorNames;h.XTickLabelRotation = 45;h.TickLabelInterpreter =“没有”;
在这种情况下,位移是最重要的预测因素,其次是马力.
predictorImportance计算树中预测器的重要性度量,方法是将每个预测器上的分裂导致的节点风险变化相加,然后将总和除以分支节点的总数。节点风险的变化是父节点的风险与两个子节点的总风险之间的差值。例如,如果一棵树将父节点(例如,节点1)拆分为两个子节点(例如,节点2和3),那么predictorImportance将分割预测器的重要性增加
predictorImportance
(R1- - - - - -R2- - - - - -R3.)/N分支,
在哪里R我节点是否有风险我,N分支分支节点的总数。一个节点的风险定义为用节点概率加权的节点误差:
R我=P我E我,
在哪里P我节点的节点概率我,E我节点的均方误差我.
预测器重要性的估计取决于是否使用代理分割进行训练。
如果你使用代理分割,predictorImportance对每个分支节点上的所有拆分(包括代理拆分)的节点风险更改进行合计。如果不使用代理拆分,则该函数取每个分支节点上找到的最佳拆分之和。
如果使用代理分割,预测器重要性的估计不依赖于预测器的顺序,但如果不使用代理分割,则依赖于顺序。
如果你使用代理分割,predictorImportance在通过修剪(或合并叶子)减少树之前计算估计值。如果不使用代理分割,predictorImportance在通过修剪减少树后计算估算值。因此,修剪会影响没有代理劈裂生长的树的预测因子的重要性,而不会影响有代理劈裂生长的树的预测因子的重要性。
该功能完全支持GPU阵列。有关更多信息,请参见在图形处理器上运行MATLAB函数(并行计算工具箱).
predictorImportance (RegressionEnsemble)|oobPermutedPredictorImportance|fitrtree|fitrensemble|plotPartialDependence
predictorImportance (RegressionEnsemble)
oobPermutedPredictorImportance
fitrensemble
plotPartialDependence
您有了这个示例的修改版本。您想用您的编辑打开这个示例吗?
你点击了一个对应于这个MATLAB命令的链接:
在MATLAB命令窗口中输入命令来运行该命令。Web浏览器不支持MATLAB命令。
选择一个网站,在可用的地方获得翻译的内容,并查看当地的活动和优惠。根据您的地理位置,我们建议您选择:.
您也可以从以下列表中选择网站:
选择中国网站(中文或英文)以获得最佳的网站表现。其他MathWorks国家网站没有针对从您的位置访问进行优化。
联系当地办事处