CogVideoX v1.5是智谱最新开源的AI视频生成模型。模型包含CogVideoX v1.5-5B和CogVideoX v1.5-5B-I2V两个版本,5B 系列模型支持生成5至10秒、768P分辨率、16帧的视频,I2V模型能处理任意尺寸比例的图像到视频的转换,结合即将开放内测的音效模型能自动生成匹配的AI音效。模型在图生视频质量、美学表现、运动合理性及复杂语义理解方面有显著提升。智谱AI已将CogVideoX v1.5开源,可通过GitHub访问其代码。

CogVideoX v1.5 – 智谱最新开源的AI视频生成模型  第1张
(图片来源网络,侵删)
CogVideoX v1.5 – 智谱最新开源的AI视频生成模型  第2张
(图片来源网络,侵删)