speech2text

语音到文本的自动转换

6.3 k下载

更新2022年10月27日星期四18:16:55 +0000

查看许可协议

语音录音的自动标记和标记,评估用于语音和语音增强的DSP管道的性能,对语音录音运行文本分析等等。
此条目允许您使用单个函数调用将采样的语音记录转换为MATLAB矢量为字符串。从MATLAB版本R2022a开始,这也使您能够使用Signal Labeler应用程序交互式地执行语音转录。
您将需要“音频工具箱”许可证、互联网连接以及您选择的语音转文本服务的活跃订阅-谷歌™云语音转文本API、IBM™Watson语音转文本API、Microsoft™Azure语音服务API或Amazon™transcripscribe。Amazon scribe™要求R2022b或更高版本。
从MATLAB R2022b开始,您可以使用带有预先训练的wav2vec 2.0模型的speech2text,而无需从File Exchange下载此功能。有关更多信息,请参见: //www.ru-cchi.com/help/audio/ref/speech2text.html
有关如何开始的详细说明,请参阅示例选项卡。
参见:自动文本到语音合成(text2speech) //www.ru-cchi.com/matlabcentral/fileexchange/73326-text2speech

引用作为

MathWorks音频工具箱团队(2023年)。speech2text(//www.ru-cchi.com/matlabcentral/fileexchange/65266-speech2text), MATLAB中央文件交换。检索

MATLAB版本兼容性
由R2022b创建
兼容R2018b及后续版本
平台的兼容性
窗户 macOS Linux

世界杯预选赛小组名单社区寻宝

在MATLAB Central中找到宝藏,并发现社区如何帮助您!世界杯预选赛小组名单

开始狩猎!

speech2text /例子

版本 发表 发布说明
1.2.18

增加了对亚马逊转录的支持。

1.2.17

-编辑实例现场脚本

1.2.16

-更新描述和MLX文件

1.2.15

增加音频工具箱作为所需的产品。

1.2.14

改进了语音客户端的命令行帮助。

1.2.13

修复了HTTPTimeOut参数在speech2text解析中的错误。该错误在1.2.12中引入

1.2.12

更新到支持wav2vec 2.0的R2022b speech2text。

1.2.11

对IBM url的更改做出反应

1.2.10

固定的谷歌客户端日化

1.2.9

包括丢失IBM身份验证步骤,这会导致旧凭证出现错误。

1.2.8

重新上传为工具箱文件

1.2.7

重新上传以修复损坏的工具箱文件

1.2.6

处理Microsoft API的新身份验证令牌格式。

1.2.5

添加链接到text2speech

1.2.4

当音频工具箱许可证不可用时,更好的错误处理

1.2.3

允许为谷歌客户端指定自定义识别URL。这提供了一种使用谷歌云语音到文本API的beta版本的方法。

1.2.2

防止将安装脚本添加到MATLAB路径

1.2.1 "

错误修复

1.2.0

在MATLAB版本R2019b中使用音频标签器增加了对交互式语音到文本转录的支持

1.1.5.0

解决旧MATLAB版本(R2017a和R2017b)中的兼容性问题

1.1.4.0

增加了对IBM和Microsoft api的新身份验证方案的支持。

1.1.3.0

正确的路径更新安装

1.1.2.0

改进了使用Microsoft API时响应中错误和数据缺乏的处理。

1.1.1.0

针对IBM API更改的更新

1.1.0.0

在files /en下添加文件,以启用p编码文件的cmd行帮助。
增加了HTTPTimeOut选项,允许使用更长的语音录音。
增加了错误消息,以更好地处理HTTP请求成功但API没有返回任何转录数据的场景

1.0.0.0

Baidu
map