VGGish预处理
对音频进行VGGish特征提取预处理
- 库:
音频工具箱/深度学习
描述
VGGish预处理块从音频输入中生成mel谱图,然后您可以将该谱图提供给VGGish预训练的网络或接受与VGGish相同输入的网络。
港口
输入
输出
参数
模型的例子
块特征
数据类型 |
|
直接引线 |
|
多维信号 |
|
适应信号 |
|
讨论二阶导数过零检测 |
|
算法
参考文献
[1]格梅克,约特F.,丹尼尔P. W.埃利斯,迪伦弗里德曼,艾伦詹森,韦德劳伦斯,R.钱宁摩尔,马诺基普拉卡尔和马文里特。“音频集:音频事件的本体和人类标记数据集。”在2017 IEEE声学、语音和信号处理国际会议, 776 - 80。新奥尔良,洛杉矶:IEEE, 2017。https://doi.org/10.1109/ICASSP.2017.7952261。
[2] Hershey, Shawn, Sourish Chaudhuri, Daniel P. W. Ellis, Jort F. Gemmeke, Aren Jansen, R. Channing Moore, Manoj Plakal等,《CNN大规模音频分类的架构》。在2017 IEEE声学、语音和信号处理国际会议131 - 35。新奥尔良,洛杉矶:IEEE, 2017。https://doi.org/10.1109/ICASSP.2017.7952132。
扩展功能
版本历史
介绍了R2022a