AI编程AI开源项目

Massively Multilingual Speech

1,100 多种语言推出语音转文本、文本转语音等功能,语音转文本的错误率只有 Whisper 的一半

标签:
阿里绘蛙

Facebook AI推出了一款多语言语音识别模型,它是目前最先进的系统之一,可以同时支持多种语言的语音识别,包括非标准化和口音较重的语音。该模型使用了先进的深度学习技术和自监督学习方法,以更好地利用大量未标记的数据进行训练,并在多项基准测试中取得了最优秀的结果。这一技术的应用可以极大地提高语音识别的准确性和可用性,为用户提供更好的语音交互体验。

相关导航

暂无评论

暂无评论...