主要内容

Pretrained模型

转移学习,声音分类,特征嵌入,预训练音频深度学习网络

音频工具箱™提供MATLAB®和仿真软件®支持预先训练的音频深度学习网络。用YAMNet定位和分类声音,用CREPE估计音高。提取VGGish或OpenL3特征嵌入输入到机器学习和深度学习系统。使用i向量系统生成音频信号的紧凑表示,用于说话人识别、验证、识别和区分、语音情感识别和声学机器故障检测等应用。

此功能需要深度学习工具箱™。音频工具箱预先训练的网络可在深层网络设计师(深度学习工具箱)

功能

全部展开

vggish VGGish神经网络
vggishPreprocess 对音频进行VGGish特征提取预处理
vggishEmbeddings 提取VGGish特征嵌入
classifySound 对音频信号中的声音进行分类
yamnet YAMNet神经网络
yamnetGraph YAMNet AudioSet本体图
yamnetPreprocess 预处理音频用于YAMNet分类
openl3 OpenL3神经网络
openl3Preprocess 对OpenL3特征提取的音频进行预处理
openl3Embeddings 提取OpenL3特性嵌入
绉神经网络
crepePreprocess CREPE深度学习网络音频预处理
crepePostprocess CREPE深度学习网络的后处理输出
pitchnn 用深度学习神经网络估计音高
ivectorSystem 创建矢量i系统
speakerRecognition 训练有素的说话人识别系统

全部展开

VGGish嵌入 提取VGGish嵌入
VGGish预处理 对音频进行VGGish特征提取预处理
VGGish VGGish嵌入式提取网络
声音分类器 对音频信号中的声音进行分类
YAMNet YAMNet声音分类网络
YAMNet预处理 预处理音频用于YAMNet分类
OpenL3嵌入 提取OpenL3嵌入
OpenL3预处理 预处理音频用于OpenL3嵌入提取
OpenL3 OpenL3嵌入式提取网络

应用程序

深层网络设计师 设计、可视化和训练深度学习网络

主题

Baidu
map