Massively Multilingual Speech

AI编程AI开源项目

Massively Multilingual Speech

1,100 多种语言推出语音转文本、文本转语音等功能，语音转文本的错误率只有 Whisper 的一半

标签：AI开源项目ai

链接直达手机查看

阿里绘蛙

Facebook AI推出了一款多语言语音识别模型，它是目前最先进的系统之一，可以同时支持多种语言的语音识别，包括非标准化和口音较重的语音。该模型使用了先进的深度学习技术和自监督学习方法，以更好地利用大量未标记的数据进行训练，并在多项基准测试中取得了最优秀的结果。这一技术的应用可以极大地提高语音识别的准确性和可用性，为用户提供更好的语音交互体验。

相关导航

网易见外

一个集视频听翻、直播听翻、语音转写、文档直翻功能为一体的AI智能语音转写听翻平台

OpenVoiceOS

OpenVoiceOS

展示了开源语音AI在各种设备中的威力

Prompt提示词交易平台，极大提高绘画等工作生产效率

facefusion

一款下一代的人脸交换和增强应用程序

Text2Cinemagraph

Text2Cinemagraph

文本来生成具有艺术风格的Cinemagraph动态图片

Tantivy

全文本搜索引擎库

暂无评论

暂无评论...