AI 资讯雷峰网·4 小时前

MiniMax M3 实测：第一流的模型，已经对执行层动手了

AI 深度解读

背景

过去一年，大模型行业经历了从单纯追求 Benchmark 跑分向追求落地可用性的范式转移。随着 Claude Code、Codex 等 Agent 产品逐渐成为开发者的主要入口，模型厂商仅靠售卖 Token 的商业模式正迅速失去壁垒，API 供应商越来越容易被替代。在此背景下，模型能力的领先若无法转化为执行层的优势，便难以构筑持久的商业护城河。

MiniMax 最新发布的旗舰模型 M3，以及同步推出的 MiniMax Code，正是这一行业转折点的缩影。M3 不仅在模型参数和 Benchmark 上对标国际顶尖旗舰，更关键的是，它试图通过强化 Coding、Agent 与多模态能力，并捆绑 Agent 执行层产品，直接争夺开发者工作流的入口。M3 的发布，意味着 MiniMax 已经不再满足于做一家底层模型供应商，而是试图在 Agent 生态中建立自己的闭环。

核心内容

M3 的核心能力进化：从写代码到执行长任务

MiniMax M3 的重点强化方向是 Coding 与 Agent 能力，但其核心诉求并非传统代码模型的“把代码写出来”，而是强调长期规划、多轮协作和自主执行复杂任务。官方展示了两个典型案例：M3 用近 12 小时自主复现 ICLR 论文，以及用约 24 小时、147 轮迭代完成 CUDA Kernel 优化。这两者均是典型的长链路任务，要求模型具备目标理解、步骤拆解、中间结果校验及失败调整的能力。

为支撑此类场景，M3 在模型架构上搭载了 1M token 上下文窗口和 MSA 稀疏注意力架构。长上下文的意义在于降低

查看原文 →leiphone.com

MiniMax M3 实测：第一流的模型，已经对执行层动手了

AI 深度解读

背景

核心内容

相关推荐