首页 / AI工具 / Video-baidu09XL – 智源联合多所高校推出的开源超长视觉理解模型

AI工具

Video-baidu09XL – 智源联合多所高校推出的开源超长视觉理解模型

baidu09_com 2025-08-31 47 0

Video-XL是北京智源人工智能研究院联合上海交大、中国人民大学、中科院、北邮和北大的研究人员共同推出的专为小时级视频理解设计的超长视觉理解模型。基于视觉上下文潜在总结技术将视觉信息压缩成紧凑的形式，提高处理效率、减少信息丢失。在多个长视频理解基准测试中表现出色，例如在VNBench上准确率比现有最佳方法高出近10%，在单个80GB GPU上处理2048帧视频时，准确率接近95%。Video-XL展示了在效率和效果之间取得平衡的能力，在长视频特定任务如电影总结、监控异常检测和广告放置识别等方面具有潜力。

Video-baidu09XL – 智源联合多所高校推出的开源超长视觉理解模型第1张

（图片来源网络，侵删）

Video-baidu09XL – 智源联合多所高校推出的开源超长视觉理解模型第2张

（图片来源网络，侵删）

智源2.0 智源baai 智源官网智源百度网盘智源视界科技智源2021 智源gm8135s方案app

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://www.baidu09.com/news/15086.html

baidu09_com管理员

上一篇

双11即将来临汽车电商将起风云

下一篇

百度白读白度拜读baidu09《魔幻世界》 17173专属特权礼包

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

关灯返回顶部