讯飞同传,基于科大讯飞的智能语音和语言技术,提供多场景多语种实时转写翻译、同声传译、直播字幕上屏和会议记录分享等一体化同传服务。
邦宁同传是一个免费的实时翻译软件,可以帮助我们实现同声传译及实时翻译英语字幕,支持获取麦克风和电脑里的声音
通义听悟,实时双语翻译字幕,一键高亮要点,智能提炼总结。依托大模型,为每一个人提供全新的音视频体验。
网易有道AI同传,可以中译中,英译中、英译日等多种语言,每日有免费时长
海绵音乐是由字节跳动推出的一款AI音乐生成工具,它通过利用AI技术生成个性化音乐。以
Remusic - 免费的AI音乐、歌曲生成工具
AISong.Fun 是一个使用 AI 生成歌曲的平台,支持歌词和纯音乐创作,免费提供两次生成机会。
随你所想,一键文本生成AI音乐。
昆仑万维推出国产AI音乐生成大模型「天工SkyMusic」,基于「天工3.0」超级大模型打造,支持高质量AI音乐生成、人声合成、歌词段落控制等多种功能。
Suno AI是一款生成式音频AI工具,由音乐和人工智能领域的专家开发。
是一个一站式音频创作平台,提供从播客创作、有声制作、AI创作百宝箱:AI分段、AI降噪、字幕下载、音量均衡、声音美化、智能配乐一系列功能
Stable Audio 由 Stability AI 公司创建,它利用人工智能的生成能力,只需几个简单的文字提示,就能生成几乎任何你想要的声音或歌曲
音乐创作全流程的AI自动作曲工具,集 AI 辅助作词、AI 自动作曲、编曲、混音于一体
BGM猫是由DeepMusicAl音乐团队研发的用来生成BGM的工具
网易推出的AI音乐创作平台
TME Studio是由腾讯音乐娱乐公司推出的一款在线音乐创作助手,提供包括但不限于音乐分离、MIR计算、辅助写词、智能曲谱等创作工具。助力音乐爱好者,让创作更简单。
豆包 AI 是一款功能强大的人工智能工具,具备对话交流、AI 搜索、PDF 问答、图像生成、写作辅助、音乐生成、阅读总结、解题答疑和学术探索等多种功能,
NovaMSS是以MSS领域最顶级的人工智能算法为基础,搭载了经上千首歌曲训练、调优后的模型的新一代音乐源分离工具
UVR5,终极人声去除器,使用先进的 AI技术,从音视频提取伴奏,简单易用、无需注册即可使用来获取高质量的伴奏和其他音轨文件。UVR5官网入口网址
本整合包修改自MVSEP-MDX23-Colab_v2,原项目为colab部署,作者修改了部分代码使其可以本地运行
一款基于深度神经网络的乐器和人声分离软件,能够高效准确地将音频文件中的不同元素进行分离,并生成高质量的消音伴奏
这是一个声音分离的网站,可以上传您选择的歌曲,并利用目前可用的所有声音分离 AI模型进行处理
对音视频文件自动消除人声部分,保留背景音乐。去除视频当中的人说话的声音
SpleeterGUI是一款专业且高效实用的音轨AI分离软件,向Spleeter提供一个音频文件,它就会将其分成两个、四个、五个等多个独立的音轨,它支持mp3、wav、ogg等常见音频格式
将音乐分成分离的人声和器乐轨道。是制作卡拉OK伴奏曲目或阿卡贝拉提取器的完美选择。使用了人工智能算法且完全免费使用
基于世界上最先进的人工智能技术的高质量音轨分离器,从任何音频中提取人声、伴奏和各种乐器
支持gpu,可实现本地电脑的音频转文字软件!完全免费开源!支持 Windows、macOS、Linux
基于Whisper的GUI软件:Buzz:离线语音转文字(字幕)
CapsWriter 的离线版,一个好用的 PC 端的语音输入工具、字幕转录工具。
讯飞听见依托科大讯飞的语音识别技术,打造智慧办公服务平台,提供语音转文字、录音转文字、视频会议、视频转文字、视频加字幕、同声翻译、语音翻译等服务,可满足多样化的语音转文字需求,致力于提高办公效率。
一个集视频听翻、直播听翻、语音转写、文档直翻功能为一体的AI智能语音转写听翻平台
通义听悟是阿里云通义家族新成员,是一款聚焦于音视频内容的工作学习AI助手。内置了通义千问大模型的理解与摘要能力,结合阿里云在音频AI领域深厚的积累,可帮助用户高效地完成对音频视频内容的记录、转写、摘要、整理和分析,实现通义大模型能力与场景化应用的结合,成为人人都可亲手体验和使用的效率工具。
琅琅配音是一个在线的文本转语音平台和AI配音神器,可以通过人工智能算法轻松将文本转换成音频,情感饱满、效果逼真。
使用免费在线的AI 技术,克隆声音或将文本转为语音。
AI文转语音,真人声源训练,富含情感,11种情绪,150种语种,500多个角色。
将文本转换为语音:快速、免费、50 种语言、8000 种声音
该页面展示了作者用GPT-SoVITS项目生成了十几个网络人物的声音,例如AI电棍、AI丁真、AI孙笑川、AI星瞳、AI扇宝等
在线一键语音生成网站合集,方便选择不同角色,进入网站即可看到所有生成模型,选择角色后即可生成语音,输入内容,点击生成,可调整生成结果
我们提供200多种声音选择,并支持多款热门游戏角色语音生成,如《原神》、《星穹铁道》和《英雄联盟》。
有声内容创作让你能直观地实时调整语音参数,例如声音风格、语速、音调、音量、发音和停顿等。你可以定义各种形式的声音,高效地创作更准确、更具表现力以及更个性化的声音输出。
魔音工坊,先进的配音工具和高效多人协同创作工具。除了配音工具之外,还有以下功能:软件配音、云剪辑、一键解析视频、文案提取、自动打轴、捏声音、背景音处理、人声处理
Text To Speech,文本转语音,文本朗读,让机器能够说话。构建自然说话的应用和服务,从 147 种语言和变体中选择 456 种语音。借助高表现力和类似人类的神经语音,让你的方案生动起来。
一个在线合成的网站,网站有中文,声库也有中文,支持各国语言的配音,支持语音和语速调节,最重要的网站风格非常小清新。
TTSMaker是一个在线的文本转语音工具,免费的(号称永久免费)!良心的!基于微软Azure内核的!
科大讯飞推出的AI转语音和配音工具
一键文字转语音,自媒体配音神器
内置以电影、动漫人物为原型的语音。可以结合文案语音和剧情编排一段同人作品。
一款完全免费的AI语音克隆工具——Fish.Audio,无需安装部署,直接在线网页端即可使用。
DDSP-SVC 是一个新的开源歌声转换项目,自由 AI 变声器软件。相比于著名的 SO-VITS-SVC, 它训练和合成对电脑硬件的要求要低的多,并且训练时长有数量级的缩短,和 RVC 的训练速度接近。
OpenVoice 是 myshell ai 开源的一款基于人工智能技术的语音克隆工具。
支持通过5秒音频克隆、1分钟音频克隆,也支持通过完整训练来克隆
Reecho主要提供两项领先的AI技术:5-8秒样本瞬时语音克隆,以及超拟真中文语音生成。
开源变声模型【RVC】,一个基于VITS的简单易用的语音转换(变声器)框架
AI孙燕姿 / AI歌手 / 声音克隆,歌声转换So-VITS-SVC 4.0源代码
网易云音乐与小冰智能联合推出的免费Al歌手音乐创作软件网易云音乐·X Studio
X Studio(简称XS)是北京红棉小冰科技开发的语音合成软件,支持Windows、macOS系统。它提供了各种音色的虚拟歌手,他们能迅速读懂乐谱,并像人类歌手一样,自然地演唱出来。
ACE Studio是时域科技旗下的AI歌声合成引擎,支持Android和iOS系统。Windows和macOS版命名为「ACE Studio」。特色功能:声线混合、新一代AI人声合成引擎、众多高水平的AI歌手、多维度AI演唱参数