VGGish嵌入
提取VGGish嵌入
- 库:
音频工具箱/深度学习
描述
VGGish Embeddings块使用VGGish从音频片段中提取特征嵌入。VGGish Embeddings块结合了必要的音频预处理和VGGish网络推理,并返回音频数据的紧凑表示的特征嵌入。
港口
输入
输出
参数
块特征
数据类型 |
|
直接引线 |
|
多维信号 |
|
适应信号 |
|
讨论二阶导数过零检测 |
|
算法
参考文献
[1]格梅克,约特F.,丹尼尔P. W.埃利斯,迪伦弗里德曼,艾伦詹森,韦德劳伦斯,R.钱宁摩尔,马诺基普拉卡尔和马文里特。“音频集:音频事件的本体和人类标记数据集。”在2017 IEEE声学、语音和信号处理国际会议, 776 - 80。新奥尔良,洛杉矶:IEEE, 2017。https://doi.org/10.1109/ICASSP.2017.7952261。
[2] Hershey, Shawn, Sourish Chaudhuri, Daniel P. W. Ellis, Jort F. Gemmeke, Aren Jansen, R. Channing Moore, Manoj Plakal等,《CNN大规模音频分类的架构》。在2017 IEEE声学、语音和信号处理国际会议131 - 35。新奥尔良,洛杉矶:IEEE, 2017。https://doi.org/10.1109/ICASSP.2017.7952132。
扩展功能
版本历史
介绍了R2022a