← 返回信息流
AI 资讯雷峰网·4 小时前

MiniMax M3 实测:第一流的模型,已经对执行层动手了

AI 深度解读

背景

过去一年,大模型行业经历了从单纯追求 Benchmark 跑分向追求落地可用性的范式转移。随着 Claude Code、Codex 等 Agent 产品逐渐成为开发者的主要入口,模型厂商仅靠售卖 Token 的商业模式正迅速失去壁垒,API 供应商越来越容易被替代。在此背景下,模型能力的领先若无法转化为执行层的优势,便难以构筑持久的商业护城河。

MiniMax 最新发布的旗舰模型 M3,以及同步推出的 MiniMax Code,正是这一行业转折点的缩影。M3 不仅在模型参数和 Benchmark 上对标国际顶尖旗舰,更关键的是,它试图通过强化 Coding、Agent 与多模态能力,并捆绑 Agent 执行层产品,直接争夺开发者工作流的入口。M3 的发布,意味着 MiniMax 已经不再满足于做一家底层模型供应商,而是试图在 Agent 生态中建立自己的闭环。

核心内容

M3 的核心能力进化:从写代码到执行长任务

MiniMax M3 的重点强化方向是 Coding 与 Agent 能力,但其核心诉求并非传统代码模型的“把代码写出来”,而是强调长期规划、多轮协作和自主执行复杂任务。官方展示了两个典型案例:M3 用近 12 小时自主复现 ICLR 论文,以及用约 24 小时、147 轮迭代完成 CUDA Kernel 优化。这两者均是典型的长链路任务,要求模型具备目标理解、步骤拆解、中间结果校验及失败调整的能力。

为支撑此类场景,M3 在模型架构上搭载了 1M token 上下文窗口和 MSA 稀疏注意力架构。长上下文的意义在于降低

查看原文 →leiphone.com