模型考试
-
发布了文章 2个月前
大模型集体“挂科”!全新中文网页检索测试:GPT-4o准确率仅6.2%
大模型集体“挂科”!全新中文网页检索测试:GPT-4o准确率仅6.2% 你以为大模型已经能轻松“上网冲浪”了?新基准测试集BrowseComp-ZH直接打脸主流AI。BrowseComp-ZH是一项由港科大(广州)、北...
-
发布了文章 2个月前
大模型测试题爆火,GPT-4和Claude3都跪了,LeCun转发:新Benchmark
大模型测试题爆火,GPT-4和Claude3都跪了,LeCun转发:新Benchmark 还有12款大模型全军覆没……一项新的“大模型Benchmark”在推特上爆火,LeCun也点赞转发了!而且无论是GPT-4还是C...
没有更多内容













