AI 资讯爱范儿·1 小时前

对话MiniMax择因：Agent架构即认知，终会超越人类

原标题：对话 MiniMax 择因：Agent 终会超过人类，我们又将何去何从？

速览

MiniMax研发工程师择因指出，当前大模型能力趋同，拉开差距的关键在于工程架构。其推出的Agent Team采用Leader-Worker-Verifier架构，旨在解决长程任务中的上下文污染等问题。择因认为Agent终将超越人类，MiniMax正通过快速输出认知来引领行业共识。

AI 深度解读

背景

当前 AI 行业正处于 Agent（智能体）技术加速爆发的阶段。从 Vibe Coding 的流行到 Claude Code、Cursor、Trae 等编程工具的贴身肉搏，行业竞争已从单纯的模型能力比拼，转向了模型外围“脚手架”（Harness）和 Agent 编排架构的较量。

MiniMax 作为较早布局 Agent 的公司，在 M3 旗舰模型发布前，率先基于 M2.7 模型推出了桌面端产品 MiniMax Code，并内置了主打多 Agent 编排架构的 Agent Team 功能。该功能采用了独特的 Leader-Worker-Verifier（领导-执行-验证）对抗式架构，旨在解决长程任务中的上下文污染、焦虑及 Agent 共谋等顽疾。近日，APP SO 对 MiniMax Agent 研发工程师择因（周淳辅）进行了深度对谈，探讨了 MiniMax 在 Agent 架构设计、行业认知及未来趋势上的思考。

核心内容

1. Agent Team 架构设计与发布策略

MiniMax 的 Agent Team 基于 Leader-Worker-Verifier 架构，将“干活”与“挑错”的职责拆分为不同的 Agent，并通过经过代码逻辑固化的状态机进行管理，实现彼此间的上下文隔离。这一设计主要解决长程 Agent 任务中常见的上下文污染、上下文焦虑以及 Agent 之间的“共谋”问题。

值得注意的是，MiniMax 并未等待 M3 模型发布，而是先在 M2.7 上推出了 Agent Team。择因表示，这是 MiniMax 主动掌控节奏、向外界传达最新认知的意愿体现。该架构在内部已使用一个月，核心用户反馈积极，随后将随 M3 模型全面升级至 MiniMax Code。

2. 架构优势：确定性限制与极大自由度的融合

与传统依赖提示词或多 Agent 编排不同，MiniMax 的架构在运行层面采用确定性的状态机代码，形成严格的工作流限制；而在 Agent 基建层面，则赋予 Agent 极大的自由度，允许所有 Agent 间互相通讯。

解决痛点： 当环境缺失依赖或出现错误时，Worker 或 Verifier 可通过健全机制通知其他 Agent，避免传统工作流中的卡死现象。
动态调整： 在研究类任务中，Leader 可在执行过程中随时启动、打断当前团队或加入新编排，用户也可随时介入调整。
上下文隔离： 将用户请求、环境生产资料与模型执行轨迹隔离，防止执行轨迹污染其他 Agent，特别适用于长程任务。
停止条件： 框架不预设所有生产场景，允许用户通过 Skill 定义个性化的停止条件，随着用户长期使用，Agent 会越来越懂用户。

3. 行业观点：Anthropic 与 OpenAI 的工程哲学对比

择因对比了 Anthropic 和 OpenAI 在 Agent 工程上的不同倾向：

Anthropic： 骨子里不信任模型，预设模型会作弊或耍小聪明，因此在 Harness 中处处加以约束。这种强约束框架可能导致模型在超长任务中出现“黑天鹅”效应（如偷懒糊弄）。
OpenAI： 其 Harness 核心是一个极简的 Agentic Loop，给予模型极大自由度。这种极简框架配合高遵循度的模型（如 GPT 5.5），实现了目前最强的编码和 Agent 能力。

择因认为，Agent 与模型是长短板关系。强大的 Agent 可以榨干模型能力，而强大的模型则不需要复杂的 Agent 框架。MiniMax 的思路是相信模型，给予其与人相同的操作权限，同时在脚手架中加入合理约束，融合两者之长。

4. 市场反馈与应用场景拓展

MiniMax Code 上线一个多月以来，下载和订阅量增长可观。除了编程，全模态能力催生了许多非预期的 C 端兴趣向应用，如长视频生成、古文诗朗诵音频制作等。用户反馈称，看着 Agent Team 像员工一样“打工”带来了极大的情绪价值。

在视频制作领域，择因认为随着模型能力提升，AI 抽卡和剪辑成本将大幅降低，甚至可能低于人工成本。但在专业工业生产中，仍需分工，如编导负责创意和关键帧，AI 负责执行。

5. 行业共识与壁垒

择因指出，Agent 领域的共识形成速度极快（Skill 半年，Harness 一个半月，多 Agent 一个月）。他引用一篇 71 页的论文《Agent Harness Engineering: a Survey》表示，关于 Agent 的核心逻辑已基本被概括，目前没有任何一家公司拥有绝对的壁垒。

MiniMax 的策略是成为共识的领导者、执行者和验证者，通过快速输出新认知来引领行业。同时，Agent 的普及有助于模型在更严肃的生产场景中被使用，从而提升 Token 消费量和订阅系数。

关键要点

架构创新： MiniMax Agent Team 采用 Leader-Worker-Verifier 对抗式架构，通过状态机管理和上下文隔离，解决长程任务中的上下文污染和焦虑问题。
发布节奏： 未等待 M3 模型，先在 M2.7 上发布 Agent Team，旨在快速向行业输出认知，并积累核心用户反馈。
工程哲学： 反对过度约束模型，主张给予模型高自由度，同时通过合理的 Harness 进行约束。对比 Anthropic 的强约束和 OpenAI 的极简框架，MiniMax 寻求平衡。
用户体验： 强调人与 Agent 拥有相同操作权限，支持用户随时介入、调整编排，并通过 Skill 实现个性化的停止条件定义。
应用场景： 除编程外，全模态能力在视频生成、音频制作等 C 端兴趣领域展现出巨大潜力，带来显著的情绪价值。
行业趋势： Agent 技术共识形成极快，壁垒逐渐消失。模型公司发力 Agent 的核心动机在于让模型在严肃场景中被使用，提升使用量和订阅转化。
未来展望： 择因认为，当 Agent 实现真正自进化，并在效率和成本上全面优于人类时，将是开发者的“停止时刻”，而这一未来并不遥远。

意义与影响

MiniMax 的 Agent Team 架构及其背后的设计哲学，反映了当前 AI 行业从“模型能力内卷”向“工程架构优化”转型的关键趋势。通过引入对抗式验证和上下文隔离，MiniMax 为长程、复杂 Agent 任务的稳定性提供了可行的解决方案，挑战了传统工作流的局限性。

择因对 Anthropic 与 OpenAI 工程哲学的对比分析，揭示了“信任模型”与“约束模型”两种不同路径的优劣，为行业提供了重要的参考视角。MiniMax 选择快速公开架构、推动共识形成的策略，不仅有助于确立其在 Agent 领域的领导地位，也加速了行业技术标准的统一。

此外，MiniMax Code 在非编程领域的应用拓展，证明了多 Agent 架构在通用任务处理上的潜力，预示着 Agent 将从专业开发工具演变为面向大众的生产力平台。随着 M3 模型的发布及后续迭代，MiniMax 有望进一步验证其架构在更强模型上的表现，推动 Agent 技术在工业级应用中的落地与普及。

查看原文 →ifanr.com

对话MiniMax择因：Agent架构即认知，终会超越人类

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐