机器学习

什么是机器学习?

它是如何工作的,为什么它很重要,以及如何开始

机器学习是一种教计算机从经验中学习的人工智能技术。机器学习算法使用计算方法直接从数据中“学习”信息,而不依赖预定方程作为模型。随着可供学习的样本数量的增加,算法自适应地提高其性能。深度学习是机器学习的一种特殊形式。

机器学习是如何工作的

机器学习使用两种类型的技术:监督式学习,根据已知的输入和输出数据训练模型,以便预测未来的输出无监督学习,它可以在输入数据中发现隐藏的模式或内在结构。

图1。机器学习技术包括无监督学习和有监督学习。

图1。机器学习技术包括无监督学习和有监督学习。

监督式学习

监督机器学习建立一个模型,在不确定性存在的情况下,根据证据做出预测。监督学习算法采用一组已知的输入数据和对数据(输出)的已知响应,并训练模型生成对新数据的响应的合理预测。如果你对你想要预测的输出有已知的数据,那就使用监督学习。

监督学习使用分类和回归技术来发展机器学习模型

分类技术预测离散的反应——例如,一封电子邮件是真的还是垃圾邮件,或者肿瘤是恶性的还是良性的。分类模型将输入数据分类。典型的应用包括医学成像、语音识别和信用评分。

如果可以对数据进行标记、分类或将其分为特定的组或类,则使用分类。例如,手写识别应用程序使用分类来识别字母和数字。在图像处理和计算机视觉中,无监督模式识别技术被用于目标检测和图像分割。可以找到执行分类的最常用算法在这里

回归技术预测持续的响应——例如,难以测量的物理量,如电池的充电状态、电网上的电力负荷或金融资产的价格。典型的应用包括虚拟传感、电力负荷预测和算法交易。

如果您正在处理一个数据范围,或者响应的性质是一个实数,如温度或设备故障前的时间,则使用回归技术。可以找到执行回归的最常用算法在这里

学习如何使用有监督的机器学习来训练一个模型,将输入映射到输出,并预测对新输入的响应。

无监督学习

无监督学习发现数据中隐藏的模式或内在结构。它用于从无标记响应的输入数据组成的数据集中进行推断。

聚类是最常见的无监督学习技巧。它用于探索性数据分析,以查找数据中的隐藏模式或分组。聚类分析的应用包括基因序列分析、市场研究和物体识别。

例如,如果一家手机公司想要优化他们建造手机发射塔的位置,他们可以使用机器学习来估计依赖他们发射塔的人群集群的数量。一部手机一次只能与一个信号塔通话,因此该团队使用聚类算法来设计手机信号塔的最佳位置,以优化客户群体或集群的信号接收。可以找到执行聚类的最常用算法在这里

图2。集群发现数据中的隐藏模式。

图2。集群发现数据中的隐藏模式。

了解一下无监督机器学习,它在没有标记响应的数据集中寻找模式。这种方法允许您在不确定数据包含什么信息时探索数据。

如何决定使用哪种机器学习算法?

选择正确的算法似乎是压倒性的——有监督和无监督机器学习算法有几十种,每一种都采用不同的学习方法。

没有最好的方法或一刀切。找到正确的算法在一定程度上就是试错——即使是经验丰富的数据科学家也不能在不尝试的情况下判断一个算法是否有效。但是算法的选择也取决于你正在处理的数据的大小和类型,你想从数据中得到的见解,以及这些见解将如何被使用。

图3。机器学习技术。

图3。机器学习技术。

以下是在有监督和无监督机器学习之间进行选择的一些指导方针:

  • 如果你需要训练一个模型来进行预测,例如,一个连续变量的未来值,如温度或股票价格,或一个分类,例如,从网络摄像头视频片段中识别汽车制造商,那么选择监督学习。
  • 如果您需要研究数据,并希望训练模型以找到良好的内部表示,例如将数据分割为集群,则选择无监督学习。

为什么机器学习很重要

随着大数据的兴起,机器学习已经成为解决几个领域问题的关键技术,例如:

汽车

汽车

航空航天

航空航天和国防

医疗设备

生产分析

金属、材料和采矿

医疗设备

信号处理

信号处理

更多的数据,更多的问题,更好的答案

机器学习算法在数据中找到自然模式,从而产生洞察力,帮助你做出更好的决策和预测。它们每天都被用于在医疗诊断、股票交易、能源负荷预测等方面做出关键决策。例如,媒体网站依靠机器学习筛选数百万个选项,为你提供歌曲或电影推荐。零售商利用它来洞察顾客的购买行为。

什么时候应该使用机器学习?

当您有一个涉及大量数据和大量变量的复杂任务或问题,但没有现成的公式或方程时,可以考虑使用机器学习。

机器学习和深度学习的区别是什么?

深度学习是机器学习的一种特殊形式。机器学习工作流从手动从图像中提取相关特征开始。然后,这些特征被用来创建一个模型,对图像中的对象进行分类。通过深度学习工作流,可以自动从图像中提取相关特征。此外,深度学习还可以进行“端到端学习”——给网络一个原始数据和一个要执行的任务,比如分类,然后它学习如何自动完成这项工作。

图4。比较使用机器学习(左)和深度学习(右)对车辆进行分类的方法。

在机器学习中,您手动选择特征和分类器来对图像进行排序。通过深度学习,特征提取和建模步骤是自动的。

在机器学习和深度学习之间的选择

机器学习提供了多种技术和模型,您可以根据应用程序、正在处理的数据的大小和想要解决的问题的类型进行选择。一个成功的深度学习应用程序需要非常大量的数据(数千张图像)来训练模型,以及图形处理器或图形处理单元,以快速处理您的数据。

在选择机器学习还是深度学习时,要考虑你是否拥有高性能的GPU和大量的标记数据。如果你没有这两样东西,使用机器学习而不是深度学习可能更有意义。深度学习通常更复杂,所以你至少需要几千张图像才能得到可靠的结果。

如果您选择机器学习,您可以选择在许多不同的分类器上训练您的模型。您还可以知道提取哪些特征会产生最好的结果。另外,您还可以灵活地选择方法的组合,使用不同的分类器和特性来查看哪种安排最适合您的数据。

在这个MATLAB技术演讲中了解深度学习和机器学习之间的区别。浏览几个示例,了解如何决定使用哪种方法。

用MATLAB进行机器学习

MATLAB是机器学习一件容易的事。MATLAB拥有处理大数据的工具和功能,以及使机器学习易于访问的应用程序,是将机器学习应用于数据分析的理想环境。

有了MATLAB,工程师和数据科学家可以立即访问预先构建的函数,广泛的工具箱,和专门的应用程序分类回归,聚类并利用数据来做出更好的决定。

MATLAB可以让您:

  • 使用已建立的手动和自动方法从信号和图像中提取特征,并自动选择功能使模型更紧凑
  • 通过应用各种优化功能工程特性技术
  • 比较方法,如逻辑回归,分类树,支持向量机,集成方法,和深度学习
  • 应用AutoML利用超参数调优和约简技术优化模型。
  • 将机器学习模型集成到企业系统、集群和云中,并将目标模型用于实时嵌入式硬件。
  • 为嵌入式传感器分析执行自动代码生成。
  • 支持从数据分析到部署的集成工作流。

相关的话题

MATLAB入门

机器学习的MATLAB

了解MATLAB对机器学习的支持。

教程和例子

开始使用MATLAB进行机器学习。

Baidu
map