HumanVid是香港中文大学和上海人工智能实验室共同推出的高质量数据集,专为人类图像动画训练设计。结合了现实世界视频和合成数据,通过精心设计的规则筛选高质量视频,并使用2D姿势估计和SLAM技术进行注释。HumanVid旨在提高视频生成的控制性和稳定性,通过基线模型CamAnimate验证了其有效性,在控制人物姿势和摄像机运动方面达到了先进水平。项目计划在2024年9月底公开代码和数据集。


HumanVid是香港中文大学和上海人工智能实验室共同推出的高质量数据集,专为人类图像动画训练设计。结合了现实世界视频和合成数据,通过精心设计的规则筛选高质量视频,并使用2D姿势估计和SLAM技术进行注释。HumanVid旨在提高视频生成的控制性和稳定性,通过基线模型CamAnimate验证了其有效性,在控制人物姿势和摄像机运动方面达到了先进水平。项目计划在2024年9月底公开代码和数据集。
全部评论
留言在赶来的路上...
发表评论