语音录音的自动标记和标记,评估用于语音和语音增强的DSP管道的性能,对语音录音运行文本分析等等。
此条目允许您使用单个函数调用将采样的语音记录转换为MATLAB矢量为字符串。从MATLAB版本R2022a开始,这也使您能够使用Signal Labeler应用程序交互式地执行语音转录。
您将需要“音频工具箱”许可证、互联网连接以及您选择的语音转文本服务的活跃订阅-谷歌™云语音转文本API、IBM™Watson语音转文本API、Microsoft™Azure语音服务API或Amazon™transcripscribe。Amazon scribe™要求R2022b或更高版本。
从MATLAB R2022b开始,您可以使用带有预先训练的wav2vec 2.0模型的speech2text,而无需从File Exchange下载此功能。有关更多信息,请参见:
//www.ru-cchi.com/help/audio/ref/speech2text.html
有关如何开始的详细说明,请参阅示例选项卡。
参见:自动文本到语音合成(text2speech)
//www.ru-cchi.com/matlabcentral/fileexchange/73326-text2speech
引用作为
MathWorks音频工具箱团队(2023年)。speech2text(//www.ru-cchi.com/matlabcentral/fileexchange/65266-speech2text), MATLAB中央文件交换。检索.
speech2text / en
speech2text /设置
speech2text /例子
版本 | 发表 | 发布说明 | |
---|---|---|---|
1.2.18 | 增加了对亚马逊转录的支持。 |
|
|
1.2.17 | -编辑实例现场脚本 |
|
|
1.2.16 | -更新描述和MLX文件 |
|
|
1.2.15 | 增加音频工具箱作为所需的产品。 |
|
|
1.2.14 | 改进了语音客户端的命令行帮助。 |
|
|
1.2.13 | 修复了HTTPTimeOut参数在speech2text解析中的错误。该错误在1.2.12中引入 |
|
|
1.2.12 | 更新到支持wav2vec 2.0的R2022b speech2text。 |
|
|
1.2.11 | 对IBM url的更改做出反应 |
|
|
1.2.10 | 固定的谷歌客户端日化 |
|
|
1.2.9 | 包括丢失IBM身份验证步骤,这会导致旧凭证出现错误。 |
|
|
1.2.8 | 重新上传为工具箱文件 |
|
|
1.2.7 | 重新上传以修复损坏的工具箱文件 |
|
|
1.2.6 | 处理Microsoft API的新身份验证令牌格式。 |
|
|
1.2.5 | 添加链接到text2speech |
|
|
1.2.4 | 当音频工具箱许可证不可用时,更好的错误处理 |
|
|
1.2.3 | 允许为谷歌客户端指定自定义识别URL。这提供了一种使用谷歌云语音到文本API的beta版本的方法。 |
|
|
1.2.2 | 防止将安装脚本添加到MATLAB路径 |
|
|
1.2.1 " | 错误修复 |
|
|
1.2.0 | 在MATLAB版本R2019b中使用音频标签器增加了对交互式语音到文本转录的支持 |
||
1.1.5.0 | 解决旧MATLAB版本(R2017a和R2017b)中的兼容性问题 |
|
|
1.1.4.0 | 增加了对IBM和Microsoft api的新身份验证方案的支持。 |
|
|
1.1.3.0 | 正确的路径更新安装 |
|
|
1.1.2.0 | 改进了使用Microsoft API时响应中错误和数据缺乏的处理。 |
|
|
1.1.1.0 | 针对IBM API更改的更新 |
|
|
1.1.0.0 | 在files /en下添加文件,以启用p编码文件的cmd行帮助。 |
|
|
1.0.0.0 |