WiS(Who is Spy)是淘天集团和阿里的技术研究团队推出的创新在线AI竞赛平台,专门设计用在测试和分析基于大型语言模型(LLMs)的多智能体系统(MAS)。WiS模拟“谁是卧底”游戏,参与者分为“卧底”和“平民”,基于描述各自手中的关键词互相识别。平台特色包括支持Hugging Face模型的统一评估接口、实时更新的排行榜及全面覆盖游戏胜率、策略和LLMs推理能力的综合评估。WiS模拟复杂的社交互动,为研究人员提供实验和分析LLMs在多智能体环境中行为的实用环境。

WiS – 淘天联合阿里研究团队推出的多智能体博弈游戏平台  第1张
(图片来源网络,侵删)
WiS – 淘天联合阿里研究团队推出的多智能体博弈游戏平台  第2张
(图片来源网络,侵删)