主要内容

Pretrained模型

迁移学习,声音分类,特征嵌入,预训练音频深度学习网络

音频工具箱™提供MATLAB®和仿真软件®支持预训练的音频深度学习网络。用YAMNet定位和分类声音,用CREPE估计音调。提取VGGish或OpenL3特征嵌入,输入到机器学习和深度学习系统。使用i-向量系统生成音频信号的紧凑表示,用于说话人识别、验证、识别和扩化、语音情感识别和声机故障检测等应用。

此功能需要深度学习工具箱™。音频工具箱预训练网络可在深度网络设计器(深度学习工具箱)

功能

全部展开

vggish VGGish神经网络
vggishPreprocess VGGish特征提取音频预处理
vggishEmbeddings 提取VGGish特征嵌入
classifySound 对音频信号中的声音进行分类
yamnet YAMNet神经网络
yamnetGraph YAMNet AudioSet本体图
yamnetPreprocess 对YAMNet分类音频进行预处理
openl3 OpenL3神经网络
openl3Preprocess 对OpenL3特征提取音频进行预处理
openl3Embeddings 提取OpenL3特性嵌入
CREPE神经网络
crepePreprocess CREPE深度学习网络音频预处理
crepePostprocess CREPE深度学习网络的后处理输出
pitchnn 用深度学习神经网络估计音高
ivectorSystem 创建i矢量系统
speakerRecognition 预先训练的说话人识别系统

全部展开

VGGish嵌入 提取VGGish嵌入
VGGish预处理 VGGish特征提取音频预处理
VGGish VGGish嵌入提取网络
声音分类器 对音频信号中的声音进行分类
YAMNet YAMNet声音分类网络
YAMNet预处理 对YAMNet分类音频进行预处理
OpenL3嵌入 提取OpenL3嵌入
OpenL3预处理 用于OpenL3嵌入提取的预处理音频
OpenL3 OpenL3嵌入式提取网络

应用程序

深度网络设计器 设计、可视化和训练深度学习网络

主题

Baidu
map