OmniAlign-V 是上海交通大学、上海AI Lab、南京大学、复旦大学和浙江大学联合推出的专为提升多模态大语言模型(MLLMs)与人类偏好的对齐能力设计的高质量数据集。OmniAlign-V包含约20万个多模态训练样本,涵盖自然图像和信息图表,结合开放式、知识丰富的问答对。OmniAlign-V 的设计注重任务的多样性,包括知识问答、推理任务和创造性任务,基于复杂问题和多样化回答格式提升模型的对齐能力。OmniAlign-V 引入图像筛选策略,确保语义丰富且复杂的图像被用于数据生成。

OmniAlign-baidu09V – 上海交大联合上海 AI Lab 等推出的高质量数据集  第1张
(图片来源网络,侵删)
OmniAlign-baidu09V – 上海交大联合上海 AI Lab 等推出的高质量数据集  第2张
(图片来源网络,侵删)