Eagle 2.5是英伟达推出的视觉语言模型,专注于长上下文多模态学习的 AI 模型,参数规模仅为 8B。参数量较小,但在处理高分辨率图像和长视频序列方面表现出色,性能媲美参数量更大的 Qwen 2.5-VL-72B 和 InternVL2.5-78B。Eagle 2.5 采用创新训练策略:信息优先采样和渐进式后训练。信息优先采样通过图像区域保留和自动降级采样技术,确保了图像的完整性和视觉细节的优化。渐进式后训练则通过逐步扩展上下文窗口,让模型在不同输入长度下保持稳定性能。

Eagle 2.5 – 英伟达推出的视觉语言模型  第1张
(图片来源网络,侵删)
Eagle 2.5 – 英伟达推出的视觉语言模型  第2张
(图片来源网络,侵删)