机器学习和深度学习的特征提取
特征提取是指将原始数据转化为可以处理的数字特征的过程,同时保留原始数据集中的信息。与直接将机器学习应用于原始数据相比,它能产生更好的结果。
特征提取可以手动或自动完成:
- 手动特征提取需要识别和描述与给定问题相关的特征,并实现提取这些特征的方法。在许多情况下,对背景或领域有很好的理解可以帮助做出明智的决定,确定哪些特征可能有用。经过几十年的研究,工程师和科学家已经开发出了图像、信号和文本的特征提取方法。一个简单特征的例子是信号中窗口的平均值。
- 自动特征提取使用专门的算法或深度网络从信号或图像中自动提取特征,无需人工干预。当你想要快速地从原始数据转移到开发机器学习算法时,这种技术会非常有用。小波散射就是自动特征提取的一个例子。
随着深度学习的发展,特征提取在很大程度上已经被第一层深度网络所取代——但主要是用于图像数据。对于信号和时间序列应用,特征提取仍然是第一个挑战,在建立有效的预测模型之前,需要大量的专业知识。
信号和时间序列数据的特征提取
特征提取识别信号中最具鉴别性的特征,机器学习或深度学习算法可以更容易地消耗这些特征。直接用原始信号训练机器学习或深度学习,由于数据率高、信息冗余,往往会产生较差的结果。
为工程师开发应用程序的状态监测和预测性维护,该Diagnostic Feature Designer app在预见性维护工具箱™让您提取、可视化和排序特征,以设计用于监视机器运行状况的条件指示器。
自动特征提取方法
自动特征提取是完整的一部分AutoML提供优化模型的工作流。工作流包含三个简单的步骤,自动化特征选择、模型选择和超参数调优。
从信号中自动提取特征的新高级方法已经出现。自动编码器、小波散射和深度神经网络通常用于提取特征和降低数据的维数。
小波散射网络可自动从实值时间序列和图像数据中提取低方差特征。这种方法产生的数据表示可以最小化类内的差异,同时保留类间的可辨别性。当你一开始没有很多数据时,小波散射可以很好地工作。
图像数据的特征提取
图像数据的特征提取将图像中有趣的部分作为一个紧凑的特征向量表示出来。在过去,这是通过专门的特征检测、特征提取和特征匹配算法来完成的。如今,深度学习在图像和视频分析中普遍存在,并以其将原始图像数据作为输入,跳过特征提取步骤的能力而闻名。无论你采用哪种方法,计算机视觉诸如图像配准、物体检测和分类以及基于内容的图像检索等应用,都需要图像特征的有效表示——要么通过深层网络的第一层隐式表示,要么显式应用一些长期存在的图像特征提取技术。
示例和如何
软件参考
参见:特征匹配,对象检测,图像稳定,图像处理和计算机视觉,图像识别,对象检测,对象识别,数字图像处理,光流,RANSAC,模式识别,点云,深度学习,特征选择,计算机视觉,AutoML
机器学习培训课程
在本课程中,您将确定如何使用无监督学习技术来发现大型数据集中的特征,以及如何使用监督学习技术来构建预测模型。