Voyage Multimodal-baidu093 – Voyage AI 推出的多模态嵌入模型

baidu09_com 2025-08-31 39 0

Voyage Multimodal-3 是 Voyage AI 推出的先进的多模态嵌入模型，能处理交错的文本和图像，并从 PDF、幻灯片、表格等截图中捕捉关键视觉特征，无需复杂文档解析。Voyage Multimodal-3模型在多模态检索任务中表现出色，平均检索准确率比现有最佳模型高出19.63%，支持文本和内容丰富的图像，具有类似现代视觉-语言转换器的架构，能统一处理文本和视觉数据，提供更准确的语义搜索和文档理解能力。