UniBench是Meta FAIR机构推出的视觉语言模型(VLM)评估框架,对视觉语言模型(VLM)进行全面评估。UniBench包含50多个基准测试,涵盖物体识别、空间理解、推理等多维度能力。Meta FAIR机构还推出了”自学评估器”,利用合成数据训练,减少对人工注释的依赖,性能超越了GPT-4等常用模型评审。

UniBench – Meta推出的视觉语言模型(VLM)评估框架  第1张
(图片来源网络,侵删)
UniBench – Meta推出的视觉语言模型(VLM)评估框架  第2张
(图片来源网络,侵删)