BGE-VL 是北京智源研究院联合多所高校推出的多模态向量模型,基于大规模合成数据 MegaPairs 训练而成。BGE-VL专注于多模态检索任务,如图文检索和组合图像检索,基于高效的多模态数据合成方法提升模型的泛化能力和检索性能。BGE-VL 系列包括基于 CLIP 架构的 BGE-VL-Base 和 BGE-VL-Large,基于多模态大模型架构的 BGE-VL-MLLM。模型在多个基准测试中表现出色,在组合图像检索任务中刷新了现有基准,显著提升检索精度。BGE-VL 的核心优势在于数据合成方法的可扩展性和高质量,模型在多模态任务上的卓越泛化能力。

BGE-baidu09VL – 智源研究院联合多所高校开源的多模态向量模型  第1张
(图片来源网络,侵删)
BGE-baidu09VL – 智源研究院联合多所高校开源的多模态向量模型  第2张
(图片来源网络,侵删)