基于MATLAB的自动机器学习(AutoML)
了解AutoML以及它如何简化机器学习工作流程。学习如何通过三个步骤构建优化的预测模型:
- 应用小波散射从信号或图像数据中获取特征,而不需要信号处理专业知识。
- 使用自动特征选择来识别特征的一个小子集,这有助于防止过拟合,减少模型大小,并加快训练。
- 选择自动模型选择,通过内置的超参数优化一步交付优化模型。
该视频演示了如何应用AutoML构建人类活动分类器,并使用来自移动设备的传感器数据作为输入。
MATLAB中的AutoML只需要三步就可以实现优化模型。首先,使用波长散射将原始传感器数据转换为机器学习需要的特征作为输入。接下来,自动化的特征选择允许您减少大型的特征集,从而减少最终的模型大小。最后,自动模型选择为您选择最佳的模型,并在同一步骤中优化其超参数。无需机器学习专业知识,您也可以应用这些步骤。然而,本视频使用一些技术术语来解释幕后发生的事情。
我们演示了autoML建立一个模型来分类活动,例如站立或坐着,使用来自手机的加速度计元数据。视频的其余部分将介绍MATLAB中autoML的步骤。首先,为了从信号或图像数据中获得相关特征,可以使用预定义的小波和具有矩阵函数的缩放滤波器对波长的信号进行分解,将小波散射应用到信号的缓冲区。
接下来,我们可以根据我们获得的400多个特征来训练一个模型,但这可能会导致一个大的模型不适合嵌入式设备。auoML的第二步,我们应用特征选择来减少特征的数量。这里的表格帮助您根据数据的特征选择合适的方法。
在这里,我们应用最小冗余最大相关算法,它在连续和分类特征上工作得非常好。特征排序图表表明,只有十几个特征捕捉了信号中的大部分可变性。
在选择了一小部分性能特性集之后,我们可以进行第三步——确定最佳性能模型。使用fitcauto进行分类和适合[?R ?] auto表示回归。我们只训练在前一步中选择的12个特性。该算法评估多种模型和超参数的组合,寻求最小化误差。在实践中,这可能需要数百次迭代才能完全收敛。尽管对于中等大小的数据,我们在更短的时间内看到了良好的结果,大约100次迭代。您可以在多个核上、本地计算机上或使用云实例上使用并行化来加速执行。
将autoML应用于该数据集,得到了一个准确率为96.6%的模型。总之,autoML在几个步骤中就获得了一个高度精确的模型,有效地允许工程师自己构建模型,而不需要依赖数据科学家。如果您熟悉机器学习,autoML可以为您节省常规步骤上的时间,使您能够专注于高级优化技术,如堆叠模型和设计更好的功能。欲了解更多信息,请访问我们的autoML发现页面或下面的链接。
您也可以从以下列表中选择网站:
如何获得最佳的网站性能
选择中国网站(中文或英文)以获得最佳的网站表现。其他MathWorks国家网站没有针对从您的位置访问进行优化。