AI模型对比评测:Claude 3 Opus vs GPT-4 Gemini 1.5 Pro  第1张

GPT-4 也给出了正确的电影名称,但奇怪的是,Gemini 1.5 Pro 却给出了错误的答案。我不知道谷歌在搞什么鬼。不过,Claude 3 Opus 的图像处理能力相当不错,与 GPT-4 不相上下。

given the play on words of these images, guess the name of the movie(根据这些图片的文字游戏,猜猜电影的名字)

胜出者:Claude 3 Opus 和 GPT-4

在对 Claude 3 Opus 模型进行了一天的测试后,我们发现这款模型似乎很有能力,但在一些你期望它表现出色的任务中却表现不佳。在我们的常识推理测试中,Opus 模型表现不佳,落后于 GPT-4 和 Gemini 1.5 Pro。除了遵循用户指令外,它在 NIAH(本应是其强项)和数学方面的表现也不尽如人意。

此外,请记住,Anthropic 将 Claude 3 Opus 的基准测试成绩与 GPT-4 在 2023 年 3 月首次发布时的初始报告成绩进行了比较。正如 Tolga Bilge 的那样,与 GPT-4 的最新基准分数相比,Claude 3 Opus 输给了 GPT-4。

尽管如此,Claude 3 Opus 也有自己的优势。X 上的一位用户,Claude 3 Opus 仅凭翻译对数据库就能将俄语翻译成切尔克斯语(一种很少有人会说的罕见语言)。凯文-费舍尔(Kevin Fischer)进一步,Claude 3 可以理解博士级量子物理学的细微差别。另一位用户演示了 Claude 3 Opus 一次就能学会,比 GPT-4 更好。

因此,除了基准测试和棘手的问题之外,Claude 3 在一些专业领域的表现也更出色。因此,请继续查看 Claude 3 Opus 模型,看看它是否适合您的工作流程。如果您有任何问题,请在下面的评论区告诉我们。