AI开源项目

AutoGen

一个强大的代码生成工具，可以帮助开发人员自动化生成高质量的代码，提高开发效率。

AudioSep

一款功能强大且易于使用的音频分离工具，可以根据你的描述准确分离音频文件中的不同声音源。

Video-LLaVA

一个基于深度学习的视频超分辨率（SR）和视频增强（VE）框架，由北京大学元培学院的研究团队开发。

sd-webui-faceswaplab

一个扩展功能强大的面部替换工具

llama2.c

纯 C 语言实现的 Llama 2 推理引擎

Insanely Fast Whisper

一个使用OpenAI的Whisper Large v2进行语音识别的脚本，能够在短短10分钟内转录300分钟的音频。

CodeLlama

一个用于实施代码的推理模型的项目。它提供了一种简便的方法来使用训练好的模型，以便生成代码。

FreeU

基于U-Net架构，并通过将扩散过程与传统的卷积神经网络相结合，提供了更好的图像分割结果

Shutter Encoder

一款视频、音频和图像转换软件，基于FFmpeg和其他优秀工具设计，旨在尽可能方便和高效

MidJourney Proxy

一个开源项目，它可以实现 API 形式的调用 AI 绘图。

MyHeyGen

一个平民版视频翻译工具，音频翻译，翻译校正，视频唇纹合成全流程解决方案

OpenSaaS

一个免费的、开源的、全栈的SaaS（软件即服务）启动套件，适用于React + NodeJS

Shap-E

一句话生成 3D 模型

Umi-OCR

一款完全离线的OCR图片转文字识别软件，支持命令行、HTTP接口等多种调用方式，支持截图OCR / 批量OCR / 二维码 / 数学公式识别（测试中）

ChatGPT+Midjourney

一键免费部署私人 ChatGPT+Midjourney 网页应用支持原ChatGPT-Next-Web所有功能还额外支持AI绘图、图片放大、识图、混图、垫图等等功能

Sweep

一款智能编程助手，具备代码审查、理解需求并自动编写和提交代码更改的功能

OpenVoice

一种实用性极强的即时仿声技术，只需要使用来自目标发言人的短音频，就可以模仿他们的声音，并以此生成各种语言的语音

Upscayl

免费开源的AI画质提升、无损放大图片工具

Meilisearch

一个闪电般的搜索引擎，可轻松融入您的应用程序、网站和工作流程。

Video-subtitle-remover

基于AI的图片/视频硬字幕去除、文本水印去除，无损分辨率生成去字幕、去水印后的图片/视频文件。无需申请第三方API，本地实现

Segment-Anything

一个模型，它提供了运行推理的代码、训练模型的检查点下载链接以及示例笔记本。

Sketch-a-Sketch

通过几笔简单的草图来控制扩散式图像生成的功能

MagicAvatar

输入文本、视频、音频，生成带动作的虚拟角色。

Amphion

一个开源工具包，可实现语音、声音和歌唱功能

ChatFiles

文档聊天机器人

Khoj

一个开源AI个人助手，通过分析您的个人文本或图像数据来提供服务

Bark with Voice Clone

一种强大的文本生成音频模型，具有声音克隆和多种语音合成应用方面的功能。通过使用该模型，您可以生成高质量、个性化的音频内容

Llamahub

一个第三方开源工具，用于调用LLM，实现文档语义对话

AnythingLLM

一个具有高度定制化和隐私控制的聊天型人工智能，适用于各种规模的企业

LobeChat

一个开源、可扩展的高性能聊天机器人框架，支持一键部署私有ChatGPT/LLM Web应用程序

1…3 456 7

AInav - AI导航网 | 发现AI,导航未来

AI开源项目