Vidu是什么?

Vidu是北京生数科技有限公司联合清华大学发布的中国首个长时长、高一致性、高动态性视频大模型，于2024年4月27日在中关村论坛未来人工智能先锋论坛上发布。

该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT，支持一键生成长达16秒、分辨率达1080P的高清视频内容。

生数科技还发布了AI绘画和视频生成平台PixWeaver，和3D模型生成平台VoxCraft AI，支持在线使用。Vidu在B站发布的视频演示：

Vidu模型采用团队原创的Diffusion与Transformer融合的架构U-VT，支持一键生成长达16秒、分辦率高达1080P的高清视频内容。Vidu不仅能够模拟真实物理世界，还拥有丰富想象力，具备多镜头生成、时空一致性高等特点。

根据现场演示的效果，Vidu能够模拟真实的物理世界，够生成细节复杂，并且符合真实物理规律的场景。例如合理的光影效果、细腻的人物表情等；它还具有丰富的想象力，能够生成真实世界不存在的虚构画面，创造出具有深度和复杂性的，超现实主义内容。例如：“画室里的一艘船正在海浪中驶向镜头”。

清华大学人工智能研究院副院长、生数科技首席科学家朱军表示，“作为中国自研视频大模型，Vidu还能理解中国元素，能够在视频中生成例如熊猫、龙等特有的中国元素。”

此外，Vidu能够生成复杂的动态镜头，不再局限于简单的推、拉、移等镜头，而是能够围绕统一主体，在一段画面里实现远景、近景、中景、特写等，不同镜头的切换。包括能直接生成，长镜头、追焦、转场等效果，给视频注入镜头语言。

相关导航

Vidu 是由北京生数科技有限公司与清华大学合作推出的一款创新的视频生成平台

Llama 2 是由 Meta 公司研发的先进的开源大型语言模型。这个模型在设计和性能上都进行了重大的升级，使其成为当前领先的语言处理工具。

幻方量化旗下深度求索推出的开源大模型和聊天助手

大语言模型书⽣·浦语

Claude 是一款基于 AI 大模型的对话系统，由原 OpenAI 研究副总裁 Dario Amodei 、 OpenAI 安全与政策副总裁 Daniela Amodei，以及近 10 名核心研究人员创办的名为 Anthropic 的 AI 公司所开发。

XChat是基于元象科技推出的XVERSE通用大模型的人工智能聊天助手

暂无评论...