特征提取

机器学习和深度学习的特征提取

特征提取是指将原始数据转化为可处理的数值特征,同时保留原始数据集中的信息的过程。它比直接将机器学习应用于原始数据产生更好的结果

特征提取可以手动或自动完成:

  • 手动特征提取需要识别和描述与给定问题相关的特征,并实现提取这些特征的方法。在许多情况下,对背景或领域有很好的理解可以帮助做出明智的决定,确定哪些特性可能有用。经过几十年的研究,工程师和科学家开发了图像、信号和文本的特征提取方法。一个简单特征的例子是信号中窗口的平均值。
  • 自动特征提取使用专门的算法或深度网络从信号或图像中自动提取特征,而不需要人工干预。当您想要快速地从原始数据转移到开发机器学习算法时,这种技术非常有用。小波散射是自动特征提取的一个例子。

随着深度学习的发展,特征提取在很大程度上已经被第一层深度网络所取代——但主要是用于图像数据。对于信号和时间序列应用,特征提取仍然是第一个挑战,需要大量的专业知识才能建立有效的预测模型。

信号和时间序列数据的特征提取

特征提取识别信号中最具鉴别性的特征,机器学习或深度学习算法可以更容易地使用这些特征。直接用原始信号训练机器学习或深度学习,由于数据率高和信息冗余,往往效果不佳。

机器学习分类器对信号和时间序列数据进行特征提取的原理图过程。机器学习分类器对信号和时间序列数据进行特征提取的原理图过程。

机器学习分类器对信号和时间序列数据进行特征提取的原理图过程。

信号特征和时频变换

在分析信号和传感器数据时,信号处理工具箱™而且小波工具箱™提供函数,让您测量信号在时间、频率和时频域的共同独特特征。您可以应用脉冲和跃迁度量,测量信噪比(SNR),估计频谱熵和峰度,并计算功率谱。

时频变换,如短时傅里叶变换(STFT)可以作为机器学习和深度学习模型中训练数据的信号表示。例如,卷积神经网络(CNNs)通常用于图像数据,它可以成功地从时频变换返回的二维信号表示中学习。

使用短时傅里叶变换的信号谱图。谱图显示了频率含量随时间的变化。

使用短时傅里叶变换的信号谱图。谱图显示了频率含量随时间的变化。

根据特定的应用程序或特性,可以使用其他时频转换。例如,常量q变换(CQT)提供了一个对数间隔的频率分布;连续小波变换(CWT)是识别非平稳信号中短时瞬态信号的有效方法。

音频应用程序和预测性维护功能

音频工具箱™提供了一组时频转换,包括梅尔谱图、八度音阶和伽玛通滤波器组以及离散余弦变换(DCT),通常用于音频、语音和声学。对于这些类型的信号,其他流行的特征提取方法包括梅尔频率倒谱系数(MFCC)、伽matone倒谱系数(GTCC)、音高、谐波和不同类型的音频谱描述符。的音频特征提取器工具可以帮助从相同的源信号中选择和提取不同的音频特征,同时重用任何中间计算以提高效率。

提取与机器运行状况相关的特征。

为工程师开发应用程序的状态监测和预测性维护,该诊断功能设计器应用程序预见性维护工具箱™让您提取、可视化和排列特征,以设计用于监视机器运行状况的条件指示器。

诊断功能设计器应用程序允许您设计和比较功能,以区分名义系统和故障系统。

诊断功能设计器应用程序允许您设计和比较功能,以区分名义系统和故障系统。

自动特征提取方法

自动特征提取是完整的一部分AutoML交付优化模型的工作流。工作流包含三个简单的步骤,它们自动选择特征、模型和超参数调优。

从信号中自动提取特征的新高级方法已经出现。自编码器、小波散射和深度神经网络通常用于提取特征和降低数据的维数。

小波散射网络可以自动从实值时间序列和图像数据中提取低方差特征。这种方法产生的数据表示可以最小化类内部的差异,同时保留类之间的可辨别性。当你一开始没有大量的数据时,小波散射工作得很好。

图像数据的特征提取

图像数据的特征提取将图像中感兴趣的部分表示为一个紧凑的特征向量。在过去,这是通过专门的特征检测、特征提取和特征匹配算法来完成的。今天,深度学习在图像和视频分析中很流行,并以其将原始图像数据作为输入而跳过特征提取步骤的能力而闻名。无论你采用哪种方法,计算机视觉诸如图像配准、目标检测和分类以及基于内容的图像检索等应用程序都需要图像特征的有效表示——要么通过深层网络的第一层隐式地表示,要么显式地应用一些长期存在的图像特征提取技术。

使用特征检测、特征提取和匹配相结合的方法在杂乱的场景(右)中检测目标(左)。参见示例了解详细信息。

使用特征检测、特征提取和匹配相结合的方法在杂乱的场景(右)中检测目标(左)。参见示例了解详细信息。

提供的特征提取技术计算机视觉工具箱™而且图像处理工具箱™包括:

  • 定向梯度直方图(HOG)
  • 加速的健壮特性(SURF)
  • 局部二值模式(LBP)特征
面向梯度直方图(HOG)图像特征提取(上)。创建不同大小的特征向量,通过改变细胞大小来表示图像(下)。参见示例了解详细信息。

面向梯度直方图(HOG)图像特征提取(上)。创建不同大小的特征向量,通过改变细胞大小来表示图像(下)。参见示例了解详细信息。

参见:特征匹配对象检测图像稳定图像处理和计算机视觉图像识别对象检测对象识别数字图像处理光流RANSAC模式识别点云深度学习特征选择计算机视觉AutoML

机器学习训练班

在本课程中,您将确定如何使用无监督学习技术来发现大型数据集中的特征,以及如何使用监督学习技术来构建预测模型。

Baidu
map