URO-Bench 是面向端到端语音对话模型(SDMs)的全面基准测试工具。涵盖了多语言、多轮对话、副语言信息等多维度任务,全面评估语音对话模型的性能。基准包含基础赛道和高级赛道,基础赛道有16个数据集,涉及开放性问答、事实问答等;高级赛道则包含20个数据集,涵盖代码切换问答、语音情感生成、多语言问答等更复杂的任务。

URO-baidu09Bench – AI基准测试工具,专为端到端语音对话模型设计  第1张
(图片来源网络,侵删)
URO-baidu09Bench – AI基准测试工具,专为端到端语音对话模型设计  第2张
(图片来源网络,侵删)