主要内容

语音转录与合成

为文本到语音和语音到文本使用预先训练的模型或第三方api

Audio Toolbox™提供了小词汇表识别和声音合成的示例。使用wav2vec 2.0预训练网络来执行一般的语音到文本的转录speech2text.您可以从文件交换下载音频工具箱扩展功能语音合成而且语音识别通过接口到流行的第三方api。支持的接口包括谷歌®演讲中,IBM®沃森语音和微软®Azure的演讲。

的图形化方式与语音到文本功能进行交互信号贴标签机快速标记语音区域的应用程序。

应用程序

信号贴标签机 标记信号属性、区域和感兴趣点,提取特征

功能

speech2text 将语音信号转录成文本
text2speech 从文本合成语音
speechClient 与预训练模型或第三方语音服务接口

主题

Baidu
map