一个使用OpenAI的Whisper Large v2进行语音识别的脚本,能够在短短10分钟内转录300分钟的音频。
一个用于实施代码的推理模型的项目。它提供了一种简便的方法来使用训练好的模型,以便生成代码。
基于U-Net架构,并通过将扩散过程与传统的卷积神经网络相结合,提供了更好的图像分割结果
一款视频、音频和图像转换软件,基于FFmpeg和其他优秀工具设计,旨在尽可能方便和高效
一个开源项目,它可以实现 API 形式的调用 AI 绘图。
一个平民版视频翻译工具,音频翻译,翻译校正,视频唇纹合成全流程解决方案
AI 技术在几分钟内生成自定义徽标。只需用文字描述您想要的徽标,我们的 AI 徽标生成器将在 1 分钟内为您创建令人惊叹的徽标设计。
一个免费的、开源的、全栈的SaaS(软件即服务)启动套件,适用于React + NodeJS
一句话生成 3D 模型
一款完全离线的OCR图片转文字识别软件,支持命令行、HTTP接口等多种调用方式,支持截图OCR / 批量OCR / 二维码 / 数学公式识别(测试中)
一键免费部署私人 ChatGPT+Midjourney 网页应用 支持原ChatGPT-Next-Web所有功能 还额外支持AI绘图、图片放大、识图、 混图、垫图等等功能
一款智能编程助手,具备代码审查、理解需求并自动编写和提交代码更改的功能
一种实用性极强的即时仿声技术,只需要使用来自目标发言人的短音频,就可以模仿他们的声音,并以此生成各种语言的语音
免费开源的AI画质提升、无损放大图片工具
一个闪电般的搜索引擎,可轻松融入您的应用程序、网站和工作流程。
基于AI的图片/视频硬字幕去除、文本水印去除,无损分辨率生成去字幕、去水印后的图片/视频文件。无需申请第三方API,本地实现
一个模型,它提供了运行推理的代码、训练模型的检查点下载链接以及示例笔记本。
通过几笔简单的草图来控制扩散式图像生成的功能
输入文本、视频、音频,生成带动作的虚拟角色。
一个开源工具包,可实现语音、声音和歌唱功能
文档聊天机器人
一个开源AI个人助手,通过分析您的个人文本或图像数据来提供服务
一种强大的文本生成音频模型,具有声音克隆和多种语音合成应用方面的功能。通过使用该模型,您可以生成高质量、个性化的音频内容
一个第三方开源工具,用于调用LLM,实现文档语义对话
一个具有高度定制化和隐私控制的聊天型人工智能,适用于各种规模的企业
一个开源、可扩展的高性能聊天机器人框架,支持一键部署私有ChatGPT/LLM Web应用程序
一个OpenAI接口管理和分发系统,它支持多个不同的人工智能模型,包括Azure、Anthropic Claude、Google PaLM 2、智谱ChatGLM、百度文心一言、讯飞星火认知、阿里通义千问以及360智脑
你的全能AI开发助手
个在安卓平台上运行的UiAutomator,它可以用于自动化测试和操作安卓设备
在文本输入的同时立即开始语音合成,无需等待整个文本输入完毕。