MiniMax-M1和MiniMax Agent:中国最大的开源推理模型和代理  第1张

MiniMax M1 几乎立即搜索了 30 个不同的网站,包括 District、All Events,甚至 Facebook 和 Instagram 上的活动列表。它收集了所有信息,并向我提供了所有正在进行的脱口秀活动的列表。搜索结果正确,但模型无法读取或检测活动的时间和地点。不过,它在右侧列出了所有来源网站,方便访问预订网站。

MiniMax M1 是一个具有思考能力的推理模型。因此,我将在这个任务中给它一个逻辑谜题来解答。我还会为此打开“思考”模式,以了解模型的思考过程。

提示词:“Four people are crossing a bridge at night, so they all need a torch – but they just have one that only lasts 15 minutes. Alice can cross in one minute, Ben in two minutes, Cindy in five minutes and Don in eight minutes. No more than two people can cross at a time; and when two cross, they have to go at the slower person’s pace. How do they get across in 15 minutes?”

“The optimal solution to get all four across in 15 minutes is as follows:

Key strategy: Use the two fastest individuals (Alice and Ben) to shuttle the torch efficiently, minimizing the time slower individuals (Cindy and Don) spend crossing together. This balances the need to move slower individuals while preserving torch time.”

MiniMax-M1 大约花了 2 分钟(准确地说是 125.2 秒)来思考这个问题并找到解决方案。该模型的逻辑思维过程准确无误,最终得出了正确答案。它无需回溯任何思路,但在某些时候,它的思考时间会稍长一些。

现在,让我们来看看 MiniMax 新品中最酷炫的部分——MiniMax Agent。虽然目前还处于测试阶段,但它的功能和丰富的用例使其在 AI 代理领域前景广阔。为了测试它的实力,我给它提了一个建议,让我创建一个交互式网站。具体步骤如下。

提示词:“Build an interactive website featuring a virtual tour of India.

这是它为我建立的网站:

MiniMax Agent 出色地创建了一个满足我需求的交互式网站。虽然最终的网站与我之前在提示中描述的并不完全一致,但不得不说,它的效果令人印象深刻。该代理自行查找信息、添加文本和图片、获取 API 密钥、访问谷歌地图和其他应用、构建整个系统,甚至还进行了测试。整个过程大约花了 20 分钟,甚至还提供了流程文档、测试结果以及所有其他细节。一个免费工具能如此出色地完成所有这些工作,真是令人惊叹!

您可以在此处体验完整网站:

您也可以点击此处免费试用该代理。使用您的电子邮件 ID 注册后,MiniMax 将赠送您 1,000 个免费积分,可用于运行代理。

MiniMax-M1 代表了开源 AI 的重大飞跃。它是首创的混合注意力机制 (MoE) 模型,兼具规模和计算效率。凭借惊人的 1M 令牌上下文窗口,该新模型能够进行长篇推理和文档理解。尽管训练成本低廉,但在标准基准测试中仍表现出极具竞争力甚至更优异的性能。

MiniMax Agent 也同样令人印象深刻,能够独立创建演示文稿、网站和应用程序。聊天机器人界面和侧边的实时更新功能让用户仿佛身临其境地体验编程。总而言之,MiniMax-M1 为开源模型开发树立了新的标杆。它融合了技术复杂性、经济高效性和易用性,为下一代 AI 聊天机器人和代理构建了坚实的基础。由于它免费向所有人开放,欢迎大家试用,并在评论区分享您的使用感受。