Wan2.1是阿里云开源的大模型,具备强大的视觉生成能力。Wan2.1支持和图生视频任务,包含两种尺寸的模型,14B参数的专业版擅长复杂运动生成和物理建模,性能卓越;1.3B参数的极速版能在消费级显卡上运行,显存需求低,适合二次开发和学术研究。Wan2.1模型基于因果3D VAE和视频Diffusion Transformer架构,实现高效时空压缩和长时程依赖建模。14B版本在权威评测集Vbench中,以总分86.22%大幅超越、Luma、等国内外模型,稳居榜首位置。Wan2.1开源采用Apache 2.0协议,支持多种主流框架,已在GitHub、HuggingFace和魔搭社区上线,方便开发者使用和部署。

Wan2.1 – 阿里开源的AI视频生成大模型  第1张
(图片来源网络,侵删)
Wan2.1 – 阿里开源的AI视频生成大模型  第2张
(图片来源网络,侵删)