主要内容

机器学习在MATLAB

什么是机器学习?

机器学习教计算机做人类与生俱来的事情:从经验中学习。机器学习算法使用计算方法直接从数据中“学习”信息,而不依赖预定方程作为模型。随着可供学习的样本数量的增加,算法自适应地提高其性能。

机器学习使用两种类型的技术:监督学习和无监督学习,前者在已知的输入和输出数据上训练模型,以便预测未来的输出,后者在输入数据中发现隐藏的模式或内在结构。

监督机器学习的目的是建立一个模型,在不确定性存在的情况下,根据证据进行预测。监督学习算法采用一组已知的输入数据和对数据(输出)的已知响应,并训练模型生成对新数据的响应的合理预测。监督学习使用分类和回归技术来开发预测模型。

  • 分类技术可以预测分类反应,例如,一封电子邮件是真的还是垃圾邮件,或者肿瘤是恶性的还是良性的。分类模型将输入数据分类。典型的应用包括医学成像、图像和语音识别以及信用评分。

  • 回归技术可以预测连续的响应,例如温度的变化或电力需求的波动。典型的应用包括电力负荷预测和算法交易。

无监督学习发现数据中隐藏的模式或内在结构。它用于从无标记响应的输入数据组成的数据集中进行推断。聚类是最常见的无监督学习技巧。它用于探索性数据分析,以查找数据中的隐藏模式或分组。聚类的应用包括基因序列分析、市场研究和目标识别。

选择正确的算法

选择正确的算法似乎是压倒性的——有监督和无监督机器学习算法有几十种,每一种都采用不同的学习方法。没有最好的方法或一刀切。找到正确的算法在一定程度上是建立在试验和错误的基础上的——即使是经验丰富的数据科学家也不能在不试验的情况下判断一个算法是否有效。高度灵活的模型倾向于通过建模可能是噪声的微小变化来过度拟合数据。简单的模型更容易解释,但可能准确性较低。因此,选择正确的算法需要权衡利弊,包括模型速度、准确性和复杂性。试错是机器学习的核心——如果一种方法或算法不起作用,你就尝试另一种。MATLAB®提供工具,以帮助您尝试各种机器学习模型并选择最佳的。

要查找MATLAB应用程序和函数来帮助您解决机器学习任务,请参考下表。一些机器学习任务通过使用应用程序变得更容易,而另一些则使用命令行功能。

任务 MATLAB应用程序和函数 产品 了解更多
分类来预测分类反应

使用分类学习者应用程序自动训练选择的模型,并帮助您选择最好的。您可以生成MATLAB代码来使用脚本。

要获得更多选项,可以使用命令行界面。

统计和机器学习工具箱™

在分类学习者应用程序中训练分类模型

分类功能

回归预测连续反应

使用回归学习者应用程序自动训练选择的模型,并帮助您选择最好的。您可以生成MATLAB代码来使用脚本和其他函数选项。

要获得更多选项,可以使用命令行界面。

统计和机器学习工具箱

在回归学习者应用程序中训练回归模型

回归函数

聚类 使用聚类分析函数。 统计和机器学习工具箱 聚类分析
计算金融任务,如信用评分 使用建模工具进行信用风险分析。 金融工具箱™和风险管理工具箱™ 信用风险(金融工具箱)
用神经网络进行分类和回归的深度学习 使用预训练的网络和函数来训练卷积神经网络。 深度学习工具箱™ MATLAB中的深度学习(深度学习工具箱)
面部识别,运动检测,和物体检测 使用深度学习工具进行图像处理和计算机视觉。 深度学习工具箱和计算机视觉工具箱™ 识别,对象检测和语义分割(计算机视觉工具箱)

下面的系统机器学习工作流可以帮助您解决机器学习的挑战。您可以在MATLAB中完成整个工作流程。

要将训练最好的模型集成到生产系统中,您可以使用以下工具部署统计和机器学习工具箱机器学习模型MATLAB编译器™.对于许多模型,您可以生成c代码用于预测MATLAB编码器™

在分类学习者应用程序中训练分类模型

使用Classification Learner应用程序训练模型,使用监督机器学习对数据进行分类。该应用程序允许您使用各种分类器交互式探索有监督的机器学习。

  • 自动训练选择的模型,以帮助您选择最好的模型。模型类型包括决策树、判别分析、支持向量机、逻辑回归、最近邻、朴素贝叶斯、核近似、集成和神经网络分类器。

  • 研究您的数据,指定验证方案,选择特性,并将结果可视化。默认情况下,应用程序通过应用交叉验证来防止过拟合。或者,您可以选择拒绝验证。验证结果帮助您为数据选择最佳模型。图和性能度量反映了验证的模型结果。

  • 将模型导出到工作区,以使用新数据进行预测。除了使用指定的验证方案的模型外,该应用程序总是使用完整数据训练模型,而完整模型就是您导出的模型。

  • 从应用程序生成MATLAB代码来创建脚本,使用新数据进行训练,处理庞大的数据集,或修改代码以进行进一步分析。

要了解更多,请参见在分类学习者应用程序中训练分类模型

分类学习者应用

要获得更多选项,可以使用命令行界面。看到分类

在回归学习者应用程序中训练回归模型

使用Regression Learner应用程序训练模型,使用监督机器学习预测连续数据。该应用程序允许您使用各种回归模型交互式地探索有监督的机器学习。

  • 自动训练选择的模型,以帮助您选择最好的模型。模型类型包括线性回归模型、回归树、高斯过程回归模型、支持向量机、核近似模型、回归树集合和神经网络回归模型。

  • 探索您的数据,选择功能,并可视化结果。类似于分类学习者,回归学习者默认情况下应用交叉验证。结果和可视化反映了经过验证的模型。使用结果为您的数据选择最佳模型。

  • 将模型导出到工作区,以使用新数据进行预测。除了使用指定的验证方案的模型外,该应用程序总是使用完整数据训练模型,而完整模型就是您导出的模型。

  • 从应用程序生成MATLAB代码来创建脚本,使用新数据进行训练,处理庞大的数据集,或修改代码以进行进一步分析。

要了解更多,请参见在回归学习者应用程序中训练回归模型

回归学习者应用

要获得更多选项,可以使用命令行界面。看到回归

为深度学习训练神经网络

“深度学习工具箱”使您能够使用卷积神经网络执行深度学习,用于分类、回归、特征提取和迁移学习。该工具箱提供了简单的MATLAB命令,用于创建和互连深度神经网络的层。示例和预先训练的网络使使用MATLAB进行深度学习变得容易,即使没有先进的计算机视觉算法或神经网络的广泛知识。

要了解更多,请参见MATLAB中的深度学习(深度学习工具箱)

相关的话题

外部网站

Baidu
map