什么是机器学习?|如何工作，教程和示例- MATLAB和Simulink

机器学习是如何工作的

机器学习使用两种类型的技术:监督式学习，根据已知的输入和输出数据训练模型，以便预测未来的输出无监督学习，它可以在输入数据中发现隐藏的模式或内在结构。

图1。机器学习技术包括无监督学习和有监督学习。

监督式学习

监督机器学习建立一个模型，在不确定性存在的情况下，根据证据做出预测。监督学习算法采用一组已知的输入数据和对数据(输出)的已知响应，并训练模型生成对新数据的响应的合理预测。如果你对你想要预测的输出有已知的数据，那就使用监督学习。

监督学习使用分类和回归技术来发展机器学习模型．

分类技术预测离散的反应——例如，一封电子邮件是真的还是垃圾邮件，或者肿瘤是恶性的还是良性的。分类模型将输入数据分类。典型的应用包括医学成像、语音识别和信用评分。

如果可以对数据进行标记、分类或将其分为特定的组或类，则使用分类。例如，手写识别应用程序使用分类来识别字母和数字。在图像处理和计算机视觉中，无监督模式识别技术被用于目标检测和图像分割。可以找到执行分类的最常用算法在这里．

回归技术预测持续的响应——例如，难以测量的物理量，如电池的充电状态、电网上的电力负荷或金融资产的价格。典型的应用包括虚拟传感、电力负荷预测和算法交易。

如果您正在处理一个数据范围，或者响应的性质是一个实数，如温度或设备故障前的时间，则使用回归技术。可以找到执行回归的最常用算法在这里．

监督机器学习

学习如何使用有监督的机器学习来训练一个模型，将输入映射到输出，并预测对新输入的响应。

无监督学习

无监督学习发现数据中隐藏的模式或内在结构。它用于从无标记响应的输入数据组成的数据集中进行推断。

聚类是最常见的无监督学习技巧。它用于探索性数据分析，以查找数据中的隐藏模式或分组。聚类分析的应用包括基因序列分析、市场研究和物体识别。

例如，如果一家手机公司想要优化他们建造手机发射塔的位置，他们可以使用机器学习来估计依赖他们发射塔的人群集群的数量。一部手机一次只能与一个信号塔通话，因此该团队使用聚类算法来设计手机信号塔的最佳位置，以优化客户群体或集群的信号接收。可以找到执行聚类的最常用算法在这里．

图2。集群发现数据中的隐藏模式。

非监督机器学习

了解一下无监督机器学习，它在没有标记响应的数据集中寻找模式。这种方法允许您在不确定数据包含什么信息时探索数据。

如何决定使用哪种机器学习算法?

选择正确的算法似乎是压倒性的——有监督和无监督机器学习算法有几十种，每一种都采用不同的学习方法。

没有最好的方法或一刀切。找到正确的算法在一定程度上就是试错——即使是经验丰富的数据科学家也不能在不尝试的情况下判断一个算法是否有效。但是算法的选择也取决于你正在处理的数据的大小和类型，你想从数据中得到的见解，以及这些见解将如何被使用。

图3。机器学习技术。

以下是在有监督和无监督机器学习之间进行选择的一些指导方针:

如果你需要训练一个模型来进行预测，例如，一个连续变量的未来值，如温度或股票价格，或一个分类，例如，从网络摄像头视频片段中识别汽车制造商，那么选择监督学习。
如果您需要研究数据，并希望训练模型以找到良好的内部表示，例如将数据分割为集群，则选择无监督学习。

继续探索这个话题

哪种机器学习算法适合你

用MATLAB进行机器学习

为什么机器学习很重要

随着大数据的兴起，机器学习已经成为解决几个领域问题的关键技术，例如:

汽车

航空航天和国防

生产分析

医疗设备

信号处理

什么时候应该使用机器学习?

当您有一个涉及大量数据和大量变量的复杂任务或问题，但没有现成的公式或方程时，可以考虑使用机器学习。

机器学习和深度学习的区别是什么?

深度学习是机器学习的一种特殊形式。机器学习工作流从手动从图像中提取相关特征开始。然后，这些特征被用来创建一个模型，对图像中的对象进行分类。通过深度学习工作流，可以自动从图像中提取相关特征。此外，深度学习还可以进行“端到端学习”——给网络一个原始数据和一个要执行的任务，比如分类，然后它学习如何自动完成这项工作。