一个强大的代码生成工具,可以帮助开发人员自动化生成高质量的代码,提高开发效率。
一款功能强大且易于使用的音频分离工具,可以根据你的描述准确分离音频文件中的不同声音源。
一个基于深度学习的视频超分辨率(SR)和视频增强(VE)框架,由北京大学元培学院的研究团队开发。
一个扩展功能强大的面部替换工具
纯 C 语言实现的 Llama 2 推理引擎
一个使用OpenAI的Whisper Large v2进行语音识别的脚本,能够在短短10分钟内转录300分钟的音频。
一个用于实施代码的推理模型的项目。它提供了一种简便的方法来使用训练好的模型,以便生成代码。
基于U-Net架构,并通过将扩散过程与传统的卷积神经网络相结合,提供了更好的图像分割结果
一款视频、音频和图像转换软件,基于FFmpeg和其他优秀工具设计,旨在尽可能方便和高效
一个开源项目,它可以实现 API 形式的调用 AI 绘图。
一个平民版视频翻译工具,音频翻译,翻译校正,视频唇纹合成全流程解决方案
一个免费的、开源的、全栈的SaaS(软件即服务)启动套件,适用于React + NodeJS
一句话生成 3D 模型
一款完全离线的OCR图片转文字识别软件,支持命令行、HTTP接口等多种调用方式,支持截图OCR / 批量OCR / 二维码 / 数学公式识别(测试中)
一键免费部署私人 ChatGPT+Midjourney 网页应用 支持原ChatGPT-Next-Web所有功能 还额外支持AI绘图、图片放大、识图、 混图、垫图等等功能
一款智能编程助手,具备代码审查、理解需求并自动编写和提交代码更改的功能
一种实用性极强的即时仿声技术,只需要使用来自目标发言人的短音频,就可以模仿他们的声音,并以此生成各种语言的语音
免费开源的AI画质提升、无损放大图片工具
一个闪电般的搜索引擎,可轻松融入您的应用程序、网站和工作流程。
基于AI的图片/视频硬字幕去除、文本水印去除,无损分辨率生成去字幕、去水印后的图片/视频文件。无需申请第三方API,本地实现
一个模型,它提供了运行推理的代码、训练模型的检查点下载链接以及示例笔记本。
通过几笔简单的草图来控制扩散式图像生成的功能
输入文本、视频、音频,生成带动作的虚拟角色。
一个开源工具包,可实现语音、声音和歌唱功能
文档聊天机器人
一个开源AI个人助手,通过分析您的个人文本或图像数据来提供服务
一种强大的文本生成音频模型,具有声音克隆和多种语音合成应用方面的功能。通过使用该模型,您可以生成高质量、个性化的音频内容
一个第三方开源工具,用于调用LLM,实现文档语义对话
一个具有高度定制化和隐私控制的聊天型人工智能,适用于各种规模的企业
一个开源、可扩展的高性能聊天机器人框架,支持一键部署私有ChatGPT/LLM Web应用程序