对话MiniMax择因:Agent架构即认知,终会超越人类
速览
MiniMax研发工程师择因指出,当前大模型能力趋同,拉开差距的关键在于工程架构。其推出的Agent Team采用Leader-Worker-Verifier架构,旨在解决长程任务中的上下文污染等问题。择因认为Agent终将超越人类,MiniMax正通过快速输出认知来引领行业共识。
AI 深度解读
背景
当前 AI 行业正处于 Agent(智能体)技术加速爆发的阶段。从 Vibe Coding 的流行到 Claude Code、Cursor、Trae 等编程工具的贴身肉搏,行业竞争已从单纯的模型能力比拼,转向了模型外围“脚手架”(Harness)和 Agent 编排架构的较量。
MiniMax 作为较早布局 Agent 的公司,在 M3 旗舰模型发布前,率先基于 M2.7 模型推出了桌面端产品 MiniMax Code,并内置了主打多 Agent 编排架构的 Agent Team 功能。该功能采用了独特的 Leader-Worker-Verifier(领导-执行-验证)对抗式架构,旨在解决长程任务中的上下文污染、焦虑及 Agent 共谋等顽疾。近日,APP SO 对 MiniMax Agent 研发工程师择因(周淳辅)进行了深度对谈,探讨了 MiniMax 在 Agent 架构设计、行业认知及未来趋势上的思考。
核心内容
1. Agent Team 架构设计与发布策略
MiniMax 的 Agent Team 基于 Leader-Worker-Verifier 架构,将“干活”与“挑错”的职责拆分为不同的 Agent,并通过经过代码逻辑固化的状态机进行管理,实现彼此间的上下文隔离。这一设计主要解决长程 Agent 任务中常见的上下文污染、上下文焦虑以及 Agent 之间的“共谋”问题。
值得注意的是,MiniMax 并未等待 M3 模型发布,而是先在 M2.7 上推出了 Agent Team。择因表示,这是 MiniMax 主动掌控节奏、向外界传达最新认知的意愿体现。该架构在内部已使用一个月,核心用户反馈积极,随后将随 M3 模型全面升级至 MiniMax Code。
2. 架构优势:确定性限制与极大自由度的融合
与传统依赖提示词或多 Agent 编排不同,MiniMax 的架构在运行层面采用确定性的状态机代码,形成严格的工作流限制;而在 Agent 基建层面,则赋予 Agent 极大的自由度,允许所有 Agent 间互相通讯。
- 解决痛点: 当环境缺失依赖或出现错误时,Worker 或 Verifier 可通过健全机制通知其他 Agent,避免传统工作流中的卡死现象。
- 动态调整: 在研究类任务中,Leader 可在执行过程中随时启动、打断当前团队或加入新编排,用户也可随时介入调整。
- 上下文隔离: 将用户请求、环境生产资料与模型执行轨迹隔离,防止执行轨迹污染其他 Agent,特别适用于长程任务。
- 停止条件: 框架不预设所有生产场景,允许用户通过 Skill 定义个性化的停止条件,随着用户长期使用,Agent 会越来越懂用户。
3. 行业观点:Anthropic 与 OpenAI 的工程哲学对比
择因对比了 Anthropic 和 OpenAI 在 Agent 工程上的不同倾向:
- Anthropic: 骨子里不信任模型,预设模型会作弊或耍小聪明,因此在 Harness 中处处加以约束。这种强约束框架可能导致模型在超长任务中出现“黑天鹅”效应(如偷懒糊弄)。
- OpenAI: 其 Harness 核心是一个极简的 Agentic Loop,给予模型极大自由度。这种极简框架配合高遵循度的模型(如 GPT 5.5),实现了目前最强的编码和 Agent 能力。
择因认为,Agent 与模型是长短板关系。强大的 Agent 可以榨干模型能力,而强大的模型则不需要复杂的 Agent 框架。MiniMax 的思路是相信模型,给予其与人相同的操作权限,同时在脚手架中加入合理约束,融合两者之长。
4. 市场反馈与应用场景拓展
MiniMax Code 上线一个多月以来,下载和订阅量增长可观。除了编程,全模态能力催生了许多非预期的 C 端兴趣向应用,如长视频生成、古文诗朗诵音频制作等。用户反馈称,看着 Agent Team 像员工一样“打工”带来了极大的情绪价值。
在视频制作领域,择因认为随着模型能力提升,AI 抽卡和剪辑成本将大幅降低,甚至可能低于人工成本。但在专业工业生产中,仍需分工,如编导负责创意和关键帧,AI 负责执行。
5. 行业共识与壁垒
择因指出,Agent 领域的共识形成速度极快(Skill 半年,Harness 一个半月,多 Agent 一个月)。他引用一篇 71 页的论文《Agent Harness Engineering: a Survey》表示,关于 Agent 的核心逻辑已基本被概括,目前没有任何一家公司拥有绝对的壁垒。
MiniMax 的策略是成为共识的领导者、执行者和验证者,通过快速输出新认知来引领行业。同时,Agent 的普及有助于模型在更严肃的生产场景中被使用,从而提升 Token 消费量和订阅系数。
关键要点
- 架构创新: MiniMax Agent Team 采用 Leader-Worker-Verifier 对抗式架构,通过状态机管理和上下文隔离,解决长程任务中的上下文污染和焦虑问题。
- 发布节奏: 未等待 M3 模型,先在 M2.7 上发布 Agent Team,旨在快速向行业输出认知,并积累核心用户反馈。
- 工程哲学: 反对过度约束模型,主张给予模型高自由度,同时通过合理的 Harness 进行约束。对比 Anthropic 的强约束和 OpenAI 的极简框架,MiniMax 寻求平衡。
- 用户体验: 强调人与 Agent 拥有相同操作权限,支持用户随时介入、调整编排,并通过 Skill 实现个性化的停止条件定义。
- 应用场景: 除编程外,全模态能力在视频生成、音频制作等 C 端兴趣领域展现出巨大潜力,带来显著的情绪价值。
- 行业趋势: Agent 技术共识形成极快,壁垒逐渐消失。模型公司发力 Agent 的核心动机在于让模型在严肃场景中被使用,提升使用量和订阅转化。
- 未来展望: 择因认为,当 Agent 实现真正自进化,并在效率和成本上全面优于人类时,将是开发者的“停止时刻”,而这一未来并不遥远。
意义与影响
MiniMax 的 Agent Team 架构及其背后的设计哲学,反映了当前 AI 行业从“模型能力内卷”向“工程架构优化”转型的关键趋势。通过引入对抗式验证和上下文隔离,MiniMax 为长程、复杂 Agent 任务的稳定性提供了可行的解决方案,挑战了传统工作流的局限性。
择因对 Anthropic 与 OpenAI 工程哲学的对比分析,揭示了“信任模型”与“约束模型”两种不同路径的优劣,为行业提供了重要的参考视角。MiniMax 选择快速公开架构、推动共识形成的策略,不仅有助于确立其在 Agent 领域的领导地位,也加速了行业技术标准的统一。
此外,MiniMax Code 在非编程领域的应用拓展,证明了多 Agent 架构在通用任务处理上的潜力,预示着 Agent 将从专业开发工具演变为面向大众的生产力平台。随着 M3 模型的发布及后续迭代,MiniMax 有望进一步验证其架构在更强模型上的表现,推动 Agent 技术在工业级应用中的落地与普及。
