首页 > 模型考试

模型考试

baidu09_com

发布了文章 2个月前

大模型集体“挂科”！全新中文网页检索测试：GPT-4o准确率仅6.2%

大模型集体“挂科”！全新中文网页检索测试：GPT-4o准确率仅6.2% 你以为大模型已经能轻松“上网冲浪”了？新基准测试集BrowseComp-ZH直接打脸主流AI。BrowseComp-ZH是一项由港科大（广州）、北...
AI人工智能

0 26 0
baidu09_com

发布了文章 2个月前

大模型测试题爆火，GPT-4和Claude3都跪了，LeCun转发：新Benchmark

大模型测试题爆火，GPT-4和Claude3都跪了，LeCun转发：新Benchmark 还有12款大模型全军覆没……一项新的“大模型Benchmark”在推特上爆火，LeCun也点赞转发了！而且无论是GPT-4还是C...
AI人工智能

0 35 0

没有更多内容

关灯返回顶部