R1-Omni 是阿里通义推出的基于强化学习(RLVR)的全模态大语言模型,专注于情感识别任务。通过结合视觉和音频信息,能清晰地解释情感识别的推理过程,展现出强大的情感理解能力。在多个情感识别数据集上,R1-Omni 的性能显著优于监督微调(SFT)模型,在分布外场景中表现出色,具有很强的泛化能力。

R1-baidu09Omni – 阿里通义开源的全模态大语言模型  第1张
(图片来源网络,侵删)
R1-baidu09Omni – 阿里通义开源的全模态大语言模型  第2张
(图片来源网络,侵删)