AutoML(自动机器学习)解释

自动化构建优化的机器学习模型的过程

自动机器学习(AutoML)自动化并消除了从数据集到预测模型所需的手动步骤。AutoML还降低了构建精确模型所需的专业知识水平,因此无论您是专家还是只有有限的机器学习经验,都可以使用它。通过自动化重复的任务,AutoML简化了机器学习工作流中的复杂阶段,例如:

  • 数据挖掘和预处理:识别预测能力低的变量和高度相关的变量,应剔除。
  • 特征提取与选择:自动提取特征,并从一个大的特征集中识别那些具有高预测能力的特征。
  • 型号选择与调优:自动调优模型超参数并识别性能最佳的模型。
  • 准备部署:通过代码生成,您可以将高级机器学习代码转换为C/ c++等低级语言,以便部署在内存有限、功耗低的嵌入式设备上。
AutoML简化了机器学习的工作流程。

使用AutoML简化机器学习工作流程。AutoML应用的步骤显示为浅灰色。

您可以使用MATLAB和AutoML来支持许多工作流程,如特征提取和选择以及模型选择和调优。

特征提取与选择

特征提取降低了原始数据中的高维数和可变性,识别了捕捉输入信号显著和独特部分的变量。的过程工程特性通常从从原始数据生成初始特征到选择最合适特征的一小部分。但特征工程是一个迭代的过程,其他方法如特征变换和降维可以发挥作用。

根据数据的类型,从原始数据中生成特征的方法有很多:

  • 小波散射应用预定义的小波和缩放滤波器从信号和图像数据中获得低方差特征。
  • 无监督学习方法,例如重建ICA而且稀疏的过滤,通过揭示独立组件和优化特征分布中的稀疏性,学习有效的表示。
  • 其他功能图片和音频信号可以在计算机视觉工具箱™和音频工具箱™中找到。

特征选择识别出仍然具有预测能力的特征子集,但使用的特征和模型更少。各种各样的自动特征选择方法,包括根据预测能力和学习特征的重要性以及模型参数对特征进行排名。其他特征选择方法迭代确定一组特征,以优化模型性能。

机型选型与调优

开发一个全面的机器学习模型的核心是确定在众多可用模型中哪一个对手头的任务执行得最好,然后调优它的超参数以优化性能。AutoML可以在一个步骤中优化模型和相关的超参数。一步模型优化的高效实现应用元学习,根据特征的特征将好的模型的搜索范围缩小到候选模型的子集,并通过应用贝叶斯优化,而不是计算量更大的网格和随机搜索,高效地优化每个候选模型的超参数。

如果使用其他方法(如试错)确定有前途的模型,则可以通过网格或随机搜索或前面提到的贝叶斯优化等方法对其超参数进行单独优化。

一旦您确定了一个性能模型,您就可以部署优化的模型,而不需要额外的编码。要完成这项任务,应用自动代码生成或将其集成到仿真环境中,如Simulink®

参见:统计和机器学习工具箱机器学习监督式学习特征提取特征选择数据拟合小波变换小波工具箱机器学习模型生物医学信号处理代理优化

Baidu
map