AutoML(自动机器学习)解释

自动化构建优化的机器学习模型的过程

自动化机器学习(AutoML)自动化并消除了从数据集到预测模型所需的手动步骤。AutoML还降低了构建精确模型所需的专业知识水平,因此无论您是专家还是机器学习经验有限,都可以使用它。通过自动化重复任务,AutoML简化了机器学习工作流中的复杂阶段,例如:

  • 数据挖掘和预处理:识别出预测能力较低的变量和应剔除的高度相关变量。
  • 特征提取与选择:自动提取特征,并在一个大的特征集中识别那些具有高预测能力的特征。
  • 模型选择和调优:自动调优模型超参数并识别性能最佳的模型。
  • 部署准备:通过代码生成,您可以将高级机器学习代码转换为低级语言,如C/ c++,以便部署在内存有限、功耗低的嵌入式设备上。
AutoML简化了机器学习工作流程。

使用AutoML简化机器学习工作流程。应用AutoML的步骤用浅灰色显示。

您可以使用MATLAB和AutoML来支持许多工作流程,例如特征提取和选择以及模型选择和调优。

特征提取与选择

特征提取降低了原始数据中的高维度和可变性,并确定了捕获输入信号的显著和独特部分的变量。的过程工程特性通常从从原始数据生成初始特征到选择最合适特征的一小部分。但特征工程是一个迭代的过程,其他方法如特征变换和降维可以发挥作用。

根据数据的类型,有许多方法可以从原始数据中生成特征:

  • 小波散射应用预定义的小波和缩放滤波器从信号和图像数据中获得低方差特征。
  • 无监督学习方法,如重建ICA而且稀疏的过滤,通过揭示独立组件和优化特征分布中的稀疏性来学习有效的表示。
  • 其他功能图片和音频信号可以在计算机视觉工具箱™和音频工具箱™中找到。

特征选择识别了仍然具有预测能力的特征子集,但特征更少,模型更小。各种各样的自动特征选择方法包括根据其预测能力和学习特征的重要性以及模型参数对特征进行排名。其他特征选择方法迭代确定一组优化模型性能的特征。

模型选择与调优

开发一个全面的机器学习模型的核心是在众多可用模型中确定哪个最适合手头的任务,然后调整其超参数以优化性能。AutoML可以在一个步骤中优化模型和相关超参数。一步模型优化的高效实现应用元学习,根据特征的特征将搜索好的模型缩小到候选模型的子集,并通过应用贝叶斯优化而不是计算更密集的网格和随机搜索,有效地优化每个候选模型的超参数。

如果使用其他方法(例如,试错)确定有希望的模型,则可以通过网格或随机搜索或前面提到的贝叶斯优化等方法对其超参数进行单独优化。

一旦确定了性能模型,就可以部署优化后的模型,而不需要额外的编码。要完成此任务,请应用自动代码生成或将其集成到类似Simulink的模拟环境中®

参见:统计和机器学习工具箱机器学习监督式学习特征提取特征选择数据拟合小波变换小波工具箱机器学习模型生物医学信号处理代理优化

Baidu
map