AI编程AI开源项目

MagicAvatar

输入文本、视频、音频，生成带动作的虚拟角色。

标签：AI开源项目ai

链接直达手机查看

阿里绘蛙

MagicAvatar是由字节跳动开发的多模态框架，它能够将各种输入模式（如文本、视频和音频）转换为运动信号，进而生成或激活一个虚拟形象（Avatar）。然后基于这些信号生成以形象为中心的视频。

以下是几种模式场景：

文本引导的形象生成：用户可以通过简单的文本提示来创建形象。例如，输入“一个在火山里踢踏舞的宇航员”就能生成一个相应的虚拟形象。
视频引导的形象生成：用户可以提供一个源视频，然后框架会创建一个跟随给定动作的形象。这意味着你可以录制一个动作，然后让虚拟形象模仿这个动作。
多模态形象动画：这个功能允许用户激活一个特定主题的形象。例如，你可以选择一个已经存在的虚拟形象，并通过多模态输入来激活它。
音频引导的形象生成（即将推出）：这个即将推出的功能将允许用户通过音频输入来创建形象。这意味着你可以通过说话或唱歌来生成一个动作。

相关导航

Look Scanned（仿真扫描）

Look Scanned（仿真扫描）

一个方便实用的纯前端网站，能够在浏览器中快速生成仿真扫描的PDF文件。

MidJourney Prompt Tool

MidJourney Prompt Tool

MidJourney的提示工具是一个功能强大的工具

Chidori

一种用于构建人工智能代理的反应式运行时

Prompt Silo

Prompt Silo

一个带有提示构建器的MidJourney提示数据库。您可以选择所有的MidJourney提示设置，并从风格、艺术家、主题等中选择，以根据您的需求制作完美的提示。它完全免费使用，并产生惊人的效果。

ai宇宙吧

ai宇宙吧

精品ai绘图关键词社区

TTS-Voice-Wizard

TTS-Voice-Wizard

一个语音转换工具，可以将文字转换为语音，并用OSC消息发送到VRChat上的头像显示。

暂无评论

暂无评论...