主要内容

特征提取

梅尔谱图,MFCC,音高,谱描述符

从音频信号中提取特征,作为机器学习或深度学习系统的输入。使用单独的函数,例如melSpectrogrammfcc球场,spectralCentroid,或使用audioFeatureExtractor对象来创建最小化冗余计算的特征提取管道。在实时脚本中,使用提取音频功能图形化地选择要提取的特征。

对象

audioFeatureExtractor 简化音频特征提取
ivectorSystem 创建i向量系统

实时编辑任务

提取音频功能 简化实时编辑器中的音频特征提取

功能

全部展开

audioDelta 计算δ特征
designAuditoryFilterBank 设计听觉滤波器组
melSpectrogram 梅尔·光谱图
audioDelta 计算δ特征
cepstralCoefficients 提取倒谱系数
gtcc 提取伽玛酮倒谱系数,对数能量,δ和δ - δ
mfcc 提取音频信号的MFCC、log能量、delta和delta-delta
openl3Embeddings 提取OpenL3特性嵌入
vggishEmbeddings 提取VGGish特征嵌入
audioDelta 计算δ特征
harmonicRatio 谐波比率
球场 估计音频信号的基频
pitchnn 用深度学习神经网络估计音高
audioDelta 计算δ特征
spectralCentroid 音频信号和听觉谱图的谱质心
spectralCrest 音频信号和听觉谱图的谱峰
spectralDecrease 音频信号和听觉谱图的谱降低
spectralEntropy 音频信号和听觉谱图的谱熵
spectralFlatness 音频信号和听觉谱图的谱平坦度
spectralFlux 音频信号和听觉谱图的谱通量
spectralKurtosis 音频信号和听觉谱图的谱峰度
spectralRolloffPoint 音频信号和听觉谱图的谱滚落点
spectralSkewness 音频信号和听觉谱图的谱偏度
spectralSlope 音频信号和听觉谱图的谱斜率
spectralSpread 音频信号和听觉谱图的谱扩频
erb2hz 从等效矩形带宽(ERB)尺度转换为赫兹
bark2hz 从树皮刻度转换为赫兹
mel2hz 从梅尔尺度转换为赫兹
hz2erb 从赫兹转换为等效矩形带宽(ERB)尺度
hz2bark 从赫兹转换为树皮尺度
hz2mel 从赫兹转换为梅尔尺度
phon2sone 把phon转换成sone
sone2phon 把sone转换成phon

音频δ 计算δ特征
听觉谱图 从音频中提取mel, Bark或ERB谱图
Cepstral系数 从谱图中提取倒谱系数
设计听觉滤波器组 设计频域听觉滤波器组
梅尔滤波器组设计 设计频域mel滤波器组
梅尔·光谱图 从音频中提取mel谱图
MFCC 从音频中提取mel频率倒谱系数

主题

Baidu
map