在分类学习App中训练分类模型
你可以使用分类学习器来训练这些分类器的模型:决策树、判别分析、支持向量机、逻辑回归、最近邻、朴素贝叶斯、核近似、集成和神经网络。除了训练模型,您还可以探索数据、选择特征、指定验证方案和评估结果。您可以将模型导出到工作区,以使用带有新数据的模型或生成MATLAB®了解编程分类的代码。
分类学习者模型的训练包括两个部分:
验证模型:用验证方案训练模型。默认情况下,应用程序通过应用交叉验证来防止过拟合。或者,您可以选择拒绝验证。验证过的模型在应用程序中可见。
完整模型:在没有验证的完整数据上训练模型。应用程序同时训练这个模型和验证过的模型。但是,在完整数据上训练的模型在应用程序中不可见。当您选择要导出到工作区的分类器时,Classification Learner将导出完整的模型。
请注意
该应用程序不使用测试数据进行模型训练。从应用程序导出的模型在完整数据上进行训练,不包括任何用于测试的数据。
该应用程序显示验证模型的结果。诊断措施,如模型精度,和图,如散点图或混淆矩阵图,反映验证的模型结果。您可以自动训练一个或多个分类器,比较验证结果,并选择最适合您的分类问题的模型。当您选择要导出到工作区的模型时,Classification Learner将导出完整的模型。由于Classification Learner在训练期间创建了完整模型的模型对象,因此在导出模型时不会遇到延迟时间。您可以使用导出的模型对新数据进行预测。
若要开始训练一组模型类型,请参见自动分类器训练.如果您已经知道要训练的分类器类型,请参见手动分类器训练.
自动分类器训练
您可以使用分类学习器在数据上自动训练选择的不同分类模型。
通过一次自动训练多个模型来开始。您可以快速尝试选择的模型,然后交互式地探索有前景的模型。
如果您已经知道想要的分类器类型,则可以改为训练单个分类器。看到手动分类器训练.
在应用程序选项卡,在机器学习和深度学习组中,单击分类学习者打开分类学习者应用程序。
在分类学习者选项卡,在文件部分中,点击新会话并从工作区或文件中选择数据。指定一个响应变量和用作预测器的变量。或者,单击开放打开以前保存的应用程序会话。看到选择分类数据或打开保存的应用程序会话.
在模型节中,单击箭头展开分类模型列表。选择所有Quick-To-Train.此选项训练所有可用于快速拟合的数据集的模型预置。
在火车部分中,点击火车都并选择火车都.
请注意
如果您有并行计算工具箱™,应用程序默认情况下并行训练模型。看到并行分类器训练.
类型中出现模型类型的选择模型窗格。当模型训练结束时,最佳百分比准确性(验证)分数用方框标出。
在模型窗格并打开相应的图以查看结果。
若要尝试数据集中可用的所有不可优化分类器模型预设,请单击所有在模型部份分类学习者选项卡。
在火车部分中,点击火车都并选择选择火车.
手动分类器训练
如果您想探索单个模型类型,或者如果您已经知道您想要的分类器类型,您可以一次训练一个分类器或作为一组训练分类器。
选择一个分类器。在分类学习者选项卡,在模型节中,单击分类器类型。控件最右侧的箭头,可以查看所有可用的分类器选项模型节展开分类器列表。中的不可优化模型选项模型画廊是预设的起点与不同的设置,适用于一系列不同的分类问题。
要阅读每个分类器的描述,请切换到详细信息视图。
有关每个选项的详细信息,请参见选择分类器选项.
选择分类器后,可以对模型进行训练。在火车部分中,点击火车都并选择选择火车.重复该过程以尝试不同的分类器。
或者,您可以创建几个草稿模型,然后将模型作为一个组进行训练。在火车部分中,点击火车都并选择火车都.
提示
首先试试决策树和判别法。如果模型在预测响应时不够准确,可以尝试其他具有更高灵活性的分类器。为了避免过度拟合,请寻找灵活性较低但提供足够精度的模型。
如果您想尝试相同或不同类型的所有不可优化模型,请从所有的选项。模型画廊。
或者,如果您想自动优化特定模型类型的超参数,请选择相应的超参数Optimizable建模并执行超参数优化。有关更多信息,请参见分类学习App中的超参数优化.
有关后续步骤,请参见比较和改进分类模型
并行分类器训练
如果您有并行计算工具箱,您可以使用分类学习器并行训练模型。并行训练允许您一次训练多个分类器并继续工作。
要控制并行训练,请切换使用并行按钮。火车部份分类学习者选项卡。要并行地训练草稿模型,请确保在单击之前已打开该按钮火车都.的使用并行按钮只有当您有并行计算工具箱时才可用。
的使用并行按钮默认开启。第一次点击火车都并选择火车都或选择火车时,会显示一个对话框,同时应用程序打开一个并行工作池。池打开后,您可以一次训练多个分类器。
分类器并行训练时,进度指示器出现在每个训练和队列模型上模型窗格。如果你愿意,你可以取消个别型号。在训练过程中,您可以检查模型的结果和图,并开始训练更多的分类器。
如果您有并行计算工具箱,则并行训练可用于分类学习器中的不可优化模型,并且您不需要设置UseParallel
选项statset
函数。
请注意
即使您没有并行计算工具箱,您也可以在模型训练期间保持应用程序的响应。在训练草稿模型之前,对分类学习者选项卡,在火车部分中,点击火车都并确保使用背景培训选中复选框。然后,选择火车都选择。当应用程序打开一个后台池时,会显示一个对话框。泳池开放后,当模特在后台训练时,你可以继续与应用程序互动。
比较和改进分类模型
检查准确性(验证)在模型窗格的每个模型。在模型窗格并打开相应的图以查看结果。通过检查图中的结果来比较模型性能。方法中的选项,可以重新排列图的布局,以比较多个模型的结果布局按钮,拖放图,或者选择位于模型图选项卡右侧的Document Actions箭头所提供的选项。
此外,还可以使用排序的选项。模型窗格。删除任何不需要的模型,选择模型并单击删除所选模型按钮,单击删除在模型部份分类学习者选项卡,或右键单击模型并选择删除.
选择最好的模型模型窗格,然后尝试在模型中包含和排除不同的特性。
首先,创建模型的副本。选择模型后,单击重复的在模型部份分类学习者选项卡或右键单击模型并选择重复的.
然后,单击特征选择在选项部份分类学习者选项卡。使用现有的特征排序算法选择特征。
尝试平行坐标图,以帮助您确定要删除的特征。看看是否可以通过去除低预测能力的特征来改进模型。指定要包含在模型中的预测器,并使用新选项训练新模型。比较模型之间的结果模型窗格。
你也可以尝试用PCA转换特征来降低维数。点击主成分分析在选项部份分类学习者选项卡。
为了进一步改进模型,您可以复制它,更改分类器超参数选项中的模型Hyperparameters模型剖面总结选项卡,然后使用新选项训练模型。要了解如何控制模型灵活性,请参见选择分类器选项.有关如何自动调优模型超参数的信息,请参见分类学习App中的超参数优化.
如果特征选择、PCA或新的超参数值可以改善模型,请尝试训练所有使用新设置建模类型。看看是否有其他模型类型在新设置下表现更好。
提示
为了避免过度拟合,请寻找灵活性较低但提供足够精度的模型。例如,寻找简单的模型,如决策树和判别器,这些模型快速且易于解释。如果模型预测响应不够准确,则选择其他具有更高灵活性的分类器,例如集成。要了解模型灵活性,请参见选择分类器选项.
该图显示了带有模型包含各种分类器类型的窗格。
有关比较不同分类器的逐步示例,请参见使用分类学习应用程序训练决策树.
对于接下来的步骤,生成代码以使用不同的数据训练模型,或者将训练好的模型导出到工作区,以便使用新数据进行预测。看到导出分类模型预测新数据.