帮助中心帮助中心

Pretrained模型

迁移学习，声音分类，特征嵌入，预训练音频深度学习网络

音频工具箱™提供MATLAB^®和仿真软件^®支持预训练的音频深度学习网络。用YAMNet定位和分类声音，用CREPE估计音调。提取VGGish或OpenL3特征嵌入，输入到机器学习和深度学习系统。使用i-向量系统生成音频信号的紧凑表示，用于说话人识别、验证、识别和扩化、语音情感识别和声机故障检测等应用。

此功能需要深度学习工具箱™。音频工具箱预训练网络可在深度网络设计器(深度学习工具箱)．

功能

VGGish

`vggish`	VGGish神经网络
`vggishPreprocess`	VGGish特征提取音频预处理
`vggishEmbeddings`	提取VGGish特征嵌入

YAMNet

`classifySound`	对音频信号中的声音进行分类
`yamnet`	YAMNet神经网络
`yamnetGraph`	YAMNet AudioSet本体图
`yamnetPreprocess`	对YAMNet分类音频进行预处理

OpenL3

`openl3`	OpenL3神经网络
`openl3Preprocess`	对OpenL3特征提取音频进行预处理
`openl3Embeddings`	提取OpenL3特性嵌入

绉

`绉`	CREPE神经网络
`crepePreprocess`	CREPE深度学习网络音频预处理
`crepePostprocess`	CREPE深度学习网络的后处理输出
`pitchnn`	用深度学习神经网络估计音高

i-Vectors

`ivectorSystem`	创建i矢量系统
`speakerRecognition`	预先训练的说话人识别系统

块

VGGish

VGGish嵌入	提取VGGish嵌入
VGGish预处理	VGGish特征提取音频预处理
VGGish	VGGish嵌入提取网络

YAMNet

声音分类器	对音频信号中的声音进行分类
YAMNet	YAMNet声音分类网络
YAMNet预处理	对YAMNet分类音频进行预处理

OpenL3

OpenL3嵌入	提取OpenL3嵌入
OpenL3预处理	用于OpenL3嵌入提取的预处理音频
OpenL3	OpenL3嵌入式提取网络

应用程序

深度网络设计器

设计、可视化和训练深度学习网络

主题

使用实验管理器进行音频迁移学习
配置一个实验，比较多个预训练网络应用于使用迁移学习的语音命令识别任务的性能。

相关信息

特色的例子

基于深度学习的语音指令识别

基于深度学习的语音指令识别

使用预训练的深度学习模型对流音频执行语音命令识别。

打开实时脚本

深度网络设计器中预训练音频网络的迁移学习

深度网络设计器中预训练音频网络的迁移学习

使用深度网络设计器交互地微调预先训练的网络来分类新的音频信号。

打开实时脚本

训练有素的循环卷积神经网络的三维声音事件定位与检测

训练有素的循环卷积神经网络的三维声音事件定位与检测

使用预先训练好的深度学习模型进行三维声音事件定位和检测。

打开实时脚本

训练滤波器和求和网络的三维语音增强

训练滤波器和求和网络的三维语音增强

使用预训练的滤波和和网络(FaSNet)对双音域数据进行语音增强。

打开实时脚本

Simulink中的语音指令识别

Simulink中的语音指令识别

使用Simulink模型检测音频中语音命令的存在。

开放模式

Simulink中的关键字发现

Simulink中的关键字发现

使用Simulink中预先训练好的深度学习模型来识别语音中的关键字。

打开实时脚本

使用深度学习可解释性技术研究音频分类

使用深度学习可解释性技术研究音频分类

使用可解释性技术来调查训练分类音频数据的深度神经网络的预测。

打开实时脚本