Vidu由北京生数科技与清华大学联合研发,采用融合Diffusion+Transformer的U‑ViT架构,支持文生视频、图生视频、参考生视频与主体参照,在单段视频内保持角色与场景的高一致性,可模拟真实光影与复杂运镜。
主要功能
- 生成速度:4秒片段实测约30秒;推出Vidu 2.0后,生成速度进一步提升,单段视频可在10秒内完成。
- 时长与质量:已支持一次性生成最长32秒的1080P视频,画面连贯、动态丰富。
- 一致性控制:提供主体参照与多主体一致性,复杂场景中人物、道具与场景融合稳定。
- 语义与镜头:具备强语义理解与镜头语言能力,支持多镜头切换、追焦与转场,接近电影级质感。