使用分类树预测块预测类标签
这个例子展示了如何使用分类学习者App,然后使用ClassificationTree预测块的标签预测在Simulink®。该块接受一个观察结果(预测器数据),并使用训练过的分类决策树模型返回该观察结果的预测类标签和类评分。
在分类学习应用程序中训练分类模型
在分类学习应用程序中使用超参数优化训练分类决策树模型。
1.在MATLAB®命令窗口中,加载电离层
数据集,其中包含雷达回波质量(Y
)和预测数据(X
)的34个变量。雷达返回的数据要么质量良好(‘g’
)或品质不良(“b”
).
加载电离层
数据集。确定样本大小。
负载电离层n =元素个数(Y)
n = 351
假设雷达返回是按顺序探测到的,你有前300个观测结果,但你还没有收到最后51个。将数据划分为当前和未来的样本。
prsntX = X(施用:);prsntY = Y(施用);ftrX = X(301年:,);ftrY = Y(301:结束);
2.开放分类学习者。在应用程序选项卡,应用程序部分,单击显示更多箭头显示应用程序库。在机器学习和深度学习组中,单击分类学习者.
3.在分类学习者选项卡,文件部分中,点击新会话并选择从工作空间.
4.在“从工作区新建会话”对话框中,选择矩阵prsntX
从数据集变量列表。下响应,单击从工作空间单选按钮并选择矢量prsntY
从工作空间。默认的验证选项是5倍交叉验证,以防止过拟合。对于本例,不更改默认设置。
5.若要接受默认选项并继续,请单击开始会议.
6.选择一个可优化的树模型进行训练。在分类学习者选项卡,模型部分,单击显示更多箭头打开画廊。在决策树组中,单击Optimizable树.
7.在火车部分中,点击火车都并选择选择火车.应用程序显示一个最小分类误差图因为它运行优化过程。在每次迭代中,应用程序都会尝试不同的超参数值组合,并使用到该迭代为止观察到的最小验证分类错误(用深蓝色表示)更新绘图。当应用程序完成优化过程时,它会选择优化后的超参数集,用红色方块表示。有关更多信息,请参见最小分类误差图.
该应用程序列出了优化的超参数优化结果Section的右边是plot和模型Hyperparameters模型截面总结选项卡。一般情况下,优化结果是不可重复的。
8.将模型导出到MATLAB工作区。在分类学习者选项卡,出口部分中,点击出口模式并选择出口模式,然后单击好吧.导出模型的默认名称为trainedModel
.
或者,您可以生成MATLAB代码,用与应用程序中训练模型相同的设置来训练分类模型分类学习者选项卡,出口部分中,点击生成函数.该应用程序从您的会话生成代码,并在MATLAB编辑器中显示文件。该文件定义了一个函数,该函数接受预测器和响应变量,训练分类模型,并执行交叉验证。将函数名更改为trainClassificationTreeModel
并保存函数文件。训练决策树分类模型trainClassificationTreeModel
函数。
trainedModel = trainClassificationTreeModel (prsntX prsntY);
9.中提取训练过的模型trainedModel
变量。trainedModel
包含一个ClassificationTree
中的模型对象ClassificationTree
字段。
treeMdl = trainedModel.ClassificationTree;
因为超参数优化会导致模型过度拟合,所以推荐的方法是在将数据导入Classification Learner应用程序之前创建一个单独的测试集,并查看优化后的模型在测试集上的表现。有关更多细节,请参见基于超参数优化的分类学习者应用程序训练分类器.
创建模型模型
本示例提供了Simulink模型slexIonosphereClassificationTreePredictExample.slx
,其中包括ClassificationTree预测块。您可以打开Simulink模型或创建一个新的模型,如本节所述。
打开Simulink模型slexIonosphereClassificationTreePredictExample.slx
.
SimMdlName =“slexIonosphereClassificationTreePredictExample”;open_system (SimMdlName)
的PreLoadFcn
回调函数的slexIonosphereClassificationTreePredictExample
包括加载样例数据、训练模型和为Simulink模型创建输入信号的代码。如果您打开Simulink模型,那么软件将在其中运行代码PreLoadFcn
在加载Simulink模型之前。查看回调函数设置上节建模选项卡上,单击模型设置并选择模型属性.然后,在回调选项卡中,选择PreLoadFcn
的回调函数模型的回调窗格。
要创建一个新的Simulink模型,请打开空白模型模板,添加分类树预测块。添加import和Outport块,并将它们连接到ClassificationTree Predict块。
双击“分类树预测”块,打开“块参数”对话框。您可以指定包含训练过的模型的工作空间变量的名称。默认变量名为treeMdl
.单击刷新按钮。对话框显示用于训练模型的选项treeMdl
下训练过的机器学习模型.选择为预测的班级成绩添加输出端口复选框添加第二个输出端口分数.
ClassificationTree Predict块期望一个包含34个预测值的观察值。双击import块,并设置港维到34信号的属性选项卡。
为Simulink模型创建一个结构数组形式的输入信号。结构数组必须包含以下字段:
时间
-观察结果进入模型的时间点。在本例中,持续时间包括从0到50的整数。方向必须与预测数据中的观测值相对应。在这种情况下,时间
必须是列向量。信号
-一个描述输入数据并包含字段的1乘1结构数组值
而且维
,在那里值
是预测数据的矩阵,和维
是预测变量的数量。
为未来的雷达返回创建一个适当的结构阵列。
radarReturnInput。时间= (0:50)';radarReturnInput.signals(1)。值= ftrX;radarReturnInput.signals(1)。尺寸大小= (ftrX 2);
从工作区导入信号数据:
打开“配置参数”对话框。在建模选项卡上,单击模型设置.
在数据导入/导出窗格中,选择输入复选框并输入
radarReturnInput
在相邻的文本框中。在解算器窗格中,在仿真时间,设置停止时间来
radarReturnInput.time(结束)
.下解算器的选择,设置类型来固定步
,并设置解算器来离散(无连续状态)
.
有关更多细节,请参见模拟负载信号数据(模型).
模拟模型。
sim (SimMdlName);
当import块检测到一个观察结果时,它将该观察结果导向ClassificationTree Predict块。您可以使用仿真数据检查(模型),查看输出端口块的记录数据。