首页 / AI工具 / ConsisID – 北大联合鹏城实验室等机构推出的文本到视频生成模型

AI工具

ConsisID – 北大联合鹏城实验室等机构推出的文本到视频生成模型

baidu09_com 2025-08-28 38 0

ConsisID是北京大学和鹏城实验室等机构推出的文本到视频（Text-to-Video, IPT2V）生成模型，基于频率分解技术保持视频中人物身份的一致性。模型用免调优（tuning-free）的Diffusion Transformer（DiT）架构，结合低频全局特征和高频内在特征，用分层训练策略生成高质量、可编辑且身份一致性强的视频。ConsisID在多个评估维度上超越现有技术，推动了身份一致性视频生成技术的发展。

ConsisID – 北大联合鹏城实验室等机构推出的文本到视频生成模型第1张

（图片来源网络，侵删）

ConsisID – 北大联合鹏城实验室等机构推出的文本到视频生成模型第2张

（图片来源网络，侵删）

北大联合大学北大联合培养的项目北大联谊北大联合纵横联合大学在北京大学的排名北京联合大学和北大什么关系北大联合实验室

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://www.baidu09.com/news/13443.html

baidu09_com管理员

上一篇

baidu09篆码生物完成数千万元种子轮融资，推进原创超小型高效基因编辑器研发

下一篇

挑战具身机器人协同操作新高度！地瓜机器人邀你共战CVPR 2025双臂协作机器人竞赛

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

关灯返回顶部