自动机器学习(AutoML)与MATLAB
了解AutoML以及它如何简化机器学习工作流程。学习如何在三个步骤中构建优化的预测模型:
- 应用小波散射从信号或图像数据中获取特征,无需信号处理专业知识。
- 使用自动特征选择来识别特征的一个小子集,这有助于防止过拟合,减少模型大小,并加快训练。
- 选择自动模型选择,通过内置的超参数优化一步交付优化模型。
视频演示了如何应用AutoML构建人类活动分类器,并使用来自移动设备的传感器数据作为输入。
MATLAB中的AutoML只需要三个步骤就可以提供优化的模型。首先,使用波长散射将原始传感器数据转换为机器学习需要的特征作为输入。接下来,自动特征选择允许您减少大型特征集,从而减少最终模型大小。最后,自动模型选择为您选择最佳模型,并在同一步骤中优化其超参数。你可以在没有机器学习专业知识的情况下应用这些步骤。然而,本视频使用一些专业术语来解释幕后发生的事情。
我们演示了autoML构建一个模型来分类活动,例如使用来自移动电话的加速度计元数据站立或坐着。视频的剩余部分将带您完成MATLAB中autoML的步骤。首先,为了从信号或图像数据中获得相关特征,可以使用预定义的小波和具有矩阵函数的缩放滤波器对波长的信号进行分解,将小波散射应用于信号的缓冲区。
接下来,我们可以继续在我们获得的400多个特征上训练一个模型,但这可能会导致一个不适合嵌入式设备的大模型。因此,在auoML中的第二步,我们应用特征选择来减少特征的数量。这里的表格帮助您根据数据的特征选择适当的方法。
在这里,我们应用最小冗余最大相关性算法,它在连续和分类特征上工作得非常好。特征排序图表表明,只有十几个特征捕获了信号中的大部分可变性。
在选择了一小部分性能特性集之后,我们可以进入第三步——确定性能最佳的模型。使用fitcauto进行分类和fit [?auto表示回归。我们只对上一步中选择的十几个特征进行训练。该算法评估了许多模型和超参数的组合,以寻求最小化误差。在实践中,这可能需要数百次迭代才能完全收敛。虽然对于中等大小的数据,我们在更短的时间内看到了很好的结果,大约100次迭代。您可以在多核、本地计算机或云实例上使用并行化来加快执行速度。
将autoML应用于该数据集,我们得到了一个在保留测试数据上精度为96.6%的模型。总之,autoML在几个步骤中获得了一个高度精确的模型,有效地允许工程师自己构建模型,而不必依赖于数据科学家。如果您熟悉机器学习,autoML可以节省您在常规步骤上的时间,使您能够专注于高级优化技术,如堆叠模型和设计更好的功能。欲了解更多信息,请访问我们的autoML发现页面或下面的链接。
特色产品
统计和机器学习工具箱
您也可以从以下列表中选择一个网站:
如何获得最佳的网站性能
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。