帮助中心帮助中心

Pretrained模型

转移学习，声音分类，特征嵌入，预训练音频深度学习网络

音频工具箱™提供MATLAB^®和仿真软件^®支持预先训练的音频深度学习网络。用YAMNet定位和分类声音，用CREPE估计音高。提取VGGish或OpenL3特征嵌入输入到机器学习和深度学习系统。使用i向量系统生成音频信号的紧凑表示，用于说话人识别、验证、识别和区分、语音情感识别和声学机器故障检测等应用。

此功能需要深度学习工具箱™。音频工具箱预先训练的网络可在深层网络设计师(深度学习工具箱)．

功能

VGGish

`vggish`	VGGish神经网络
`vggishPreprocess`	对音频进行VGGish特征提取预处理
`vggishEmbeddings`	提取VGGish特征嵌入

YAMNet

`classifySound`	对音频信号中的声音进行分类
`yamnet`	YAMNet神经网络
`yamnetGraph`	YAMNet AudioSet本体图
`yamnetPreprocess`	预处理音频用于YAMNet分类

OpenL3

`openl3`	OpenL3神经网络
`openl3Preprocess`	对OpenL3特征提取的音频进行预处理
`openl3Embeddings`	提取OpenL3特性嵌入

绉

`绉`	绉神经网络
`crepePreprocess`	CREPE深度学习网络音频预处理
`crepePostprocess`	CREPE深度学习网络的后处理输出
`pitchnn`	用深度学习神经网络估计音高

i-Vectors

`ivectorSystem`	创建矢量i系统
`speakerRecognition`	训练有素的说话人识别系统

块

VGGish

VGGish嵌入	提取VGGish嵌入
VGGish预处理	对音频进行VGGish特征提取预处理
VGGish	VGGish嵌入式提取网络

YAMNet

声音分类器	对音频信号中的声音进行分类
YAMNet	YAMNet声音分类网络
YAMNet预处理	预处理音频用于YAMNet分类

OpenL3

OpenL3嵌入	提取OpenL3嵌入
OpenL3预处理	预处理音频用于OpenL3嵌入提取
OpenL3	OpenL3嵌入式提取网络

应用程序

深层网络设计师

设计、可视化和训练深度学习网络

主题

使用实验管理器进行音频迁移学习
配置一个实验，比较多个预先训练的网络应用于使用迁移学习的语音命令识别任务的性能。

相关信息

特色的例子

基于深度学习的语音指令识别

基于深度学习的语音指令识别

使用预训练的深度学习模型对流媒体音频进行语音命令识别。

打开生活的脚本

深度网络设计器中预训练音频网络的迁移学习

深度网络设计器中预训练音频网络的迁移学习

交互式微调预先训练的网络，使用深度网络设计器分类新的音频信号。

打开生活的脚本

基于训练循环卷积神经网络的三维声音事件定位与检测

基于训练循环卷积神经网络的三维声音事件定位与检测

使用预训练的深度学习模型进行三维声音事件定位和检测。

打开生活的脚本

训练滤波器和网络的三维语音增强

训练滤波器和网络的三维语音增强

使用预训练滤波器和双音速数据的和网络(FaSNet)进行语音增强。

打开生活的脚本

Simulink中的语音指令识别

Simulink中的语音指令识别

使用Simulink模型检测音频中语音命令的存在。

开放模式

Simulink中的关键字发现

Simulink中的关键字发现

在Simulink中使用预训练的深度学习模型来识别语音中的关键词。

打开生活的脚本

使用深度学习可解释性技术研究音频分类

使用深度学习可解释性技术研究音频分类

使用可解释性技术来研究深度神经网络分类音频数据的预测。

打开生活的脚本