主要内容

训练核近似模型使用回归学习者应用程序

这个例子展示了如何使用regression Learner应用程序创建和比较各种内核近似回归模型,并将训练过的模型导出到工作区,以对新数据进行预测。核近似模型通常适用于有很多观测值的非线性回归。对于大内存数据,核近似模型往往比高斯核支持向量机模型训练和预测更快。

  1. 在MATLAB®命令窗口,加载carbig数据集,并创建一个包含不同变量的表。

    负载carbigcartable =表(加速、气缸、位移,...马力,Model_Year、重量、起源、MPG);
  2. 单击应用程序选项卡,然后单击显示更多打开应用程序库的箭头。在机器学习和深度学习组中,单击回归的学习者

  3. 回归的学习者选项卡,文件部分中,点击新会话并选择从工作空间

  4. 在“从工作区新建会话”对话框中,选择表cartable数据集变量列表。

    如对话框所示,应用程序选择英里/加仑作为响应,其他变量作为预测变量。对于本例,不要更改选择。

    “从工作区新建会话”对话框

  5. 若要接受默认验证方案并继续,请单击开始会议.默认的验证选项是5倍交叉验证,以防止过拟合。

    回归学习者创建一个响应的图,记录数字在x设在。

  6. 使用响应图来研究哪些变量对预测响应是有用的。中选择不同的变量,以可视化不同预测器与响应之间的关系X列表下在情节的右边。观察哪些变量与回答的相关性最明显。

  7. 创建内核近似模型的选择。在回归的学习者选项卡,模型部分,单击箭头打开图库。在核近似回归模型组中,单击所有的内核

  8. 火车部分中,点击火车都并选择火车都

    请注意

    • 如果您有并行计算工具箱™,那么应用程序有使用并行按钮默认开启。你点击后火车都并选择火车都选择火车,该应用程序会打开一个平行的工人池。在此期间,您不能与软件交互。池打开后,您可以继续与应用程序交互,同时模型并行训练。

    • 如果没有并行计算工具箱,则应用程序具有使用背景培训的复选框。火车都默认选择的菜单。在你选择一个训练模型的选项后,应用程序会打开一个后台池。池打开后,当模型在后台训练时,您可以继续与应用程序交互。

    Regression Learner训练库中的每个核近似选项中的一个,以及默认的精细树模型。在模型窗格,应用程序概述RMSE(验证)(均方根误差)的最佳模型。

  9. 中选择一个模型模型窗格以查看结果。在回归的学习者选项卡,情节和解释部分,单击箭头打开图库,然后单击响应验证结果组。检查训练模型的响应图。真实反应用蓝色表示,预测反应用黄色表示。

    基于核近似模型的汽车数据响应图

    请注意

    验证在结果中引入了一些随机性。您的模型验证结果可能与此示例中显示的结果不同。

  10. 中,选择马力然后检查响应图。真实反应和预测反应都画出来了。显示预测误差,在预测响应和真实响应之间画出竖线错误复选框下情节在情节的右边。

  11. 有关当前所选模型的更多信息,请参阅总结选项卡。检查和比较其他模型特征,如r平方(决定系数),MAE(平均绝对误差)和预测速度。要了解更多,请参见在“摘要”选项卡和“模型”窗格中查看模型统计信息.在总结选项卡中,您还可以找到当前所选模型类型的详细信息,例如用于训练模型的选项。

  12. 绘制预测反应与真实反应的对比图。在回归的学习者选项卡,情节和解释部分,单击箭头打开图库,然后单击预测与实际(验证)验证结果组。使用这个图来确定回归模型对不同响应值的预测效果。

    核近似模型的预测响应与真实响应的关系图

    一个完美的回归模型预测的响应等于真实的响应,所以所有的点都在一条对角线上。直线到任意点的垂直距离是对该点的预测误差。一个好的模型误差很小,所以预测是分散在直线附近的。通常,一个好的模型的点大致对称地分布在对角线周围。如果您能在图中看到任何清晰的模式,您就很有可能改进您的模型。

  13. 对于每个剩余的模型,在模型窗格,打开预测与实际的图,然后比较模型之间的结果。有关更多信息,请参见通过改变布局比较模型地块

  14. 为了改进模型,需要包含不同的特性。在模型画廊,选择所有的内核一次。看看是否可以通过删除预测能力较低的特征来改进模型。在总结选项卡上,单击特征选择展开该部分。

    特征选择部分,清除复选框加速度而且气缸把它们从预测因子中排除。响应图显示,这些变量与响应变量不高度相关。

    火车部分中,点击火车都并选择火车都选择火车用新的特征集训练核近似模型。

  15. 观察新模型模型窗格。这些模型与之前的核近似模型相同,但只使用七个预测因子中的五个进行训练。对于每个模型,应用程序会显示使用了多少个预测器。中单击模型以查看使用了哪些预测器模型浏览并查阅特征选择部分的总结选项卡。

    去掉这两个特征的模型与所有预测因子的模型的表现相当。使用所有预测因子与只使用其中一部分预测因子相比,模型的预测效果并不好。如果数据收集是昂贵的或困难的,您可能喜欢一个不需要一些预测器就能令人满意地执行的模型。

  16. 中选择模型模型窗格的最低验证RSME(最佳模型),并查看残差图。在回归的学习者选项卡,情节和解释部分,单击箭头打开图库,然后单击残差(验证)验证结果组。残差图显示了预测和真实反应之间的差异。要将残差显示为线图,请选择风格

    ,选择要在x设在。选择真实响应、预测响应、记录数或其中一个预测因子。

    核近似模型的残差图

    通常,一个好的模型的残差大致对称地分布在0附近。如果你能在残差中看到任何清晰的模式,你就很有可能改进你的模型。

  17. 你可以尝试进一步改进最好的模型模型窗格通过更改其超参数。首先,复制模型。在回归的学习者选项卡,模型部分中,点击重复的

    然后,在总结选项卡,尝试更改一些超参数设置,如内核缩放参数或正则化强度。通过单击来训练新模型火车都并选择选择火车

    要了解有关内核近似模型设置的更多信息,请参见内核近似模型

  18. 您可以将训练过的模型的精简版本导出到工作区。在回归的学习者选项卡,出口部分中,点击出口模式和选择出口模式出口紧凑的模型.注意,这两种选择都导出训练模型的精简版本,因为内核近似模型不存储训练数据。看到导出回归模型预测新数据

  19. 若要检查用于训练此模型的代码,请单击生成函数出口部分。

提示

使用相同的工作流程来评估和比较您可以在回归学习者中训练的其他回归模型类型。

为你的数据集训练所有不可优化的回归模型预设:

  1. 回归的学习者选项卡,模型部分中,单击箭头打开回归模型库。

  2. 开始组中,单击所有

    选择用于训练所有可用模型类型的选项

  3. 火车部分中,点击火车都并选择火车都

要了解其他回归模型类型,请参见在回归学习者应用程序中训练回归模型

另请参阅

|

相关的话题

Baidu
map