CAVIA是苹果公司、得克萨斯大学奥斯汀分校、谷歌联合推出的多视角视频生成框架,能将单一输入图像转换成多个时空一致的视频序列。框架基于引入视角集成注意力模块,增强视频的视角一致性和时间连贯性,支持用户精确控制相机运动,同时保留对象运动。CAVIA的设计灵活性使其能与多种数据源联合训练,显著提升视频的几何一致性和感知质量,在虚拟现实、增强现实和电影制作等领域具有应用潜力。

CAVIA – 苹果、得克萨斯、谷歌联合推出的多视角视频生成框架  第1张
(图片来源网络,侵删)
CAVIA – 苹果、得克萨斯、谷歌联合推出的多视角视频生成框架  第2张
(图片来源网络,侵删)