首页 > 浙大dcd

浙大dcd

baidu09_com

发布了文章 2个月前

VLM-baidu09R1 – 浙大 Om AI Lab 推出的视觉语言模型

VLM-R1 是 Om AI Lab 推出的基于强化学习技术的视觉语言模型，通过自然语言指令精确定位图像中的目标物体，如根据描述“图中红色的杯子”找到对应的图像区域。模型基于 Qwen2.5-VL 架构，结合 DeepSee...
AI工具

0 32 0

没有更多内容

关灯返回顶部