← 返回信息流
创投信息钛媒体·3 天前

MiniMax发布M3模型,主打百万上下文与Agent能力

原标题:MiniMax发布新模型M3,竞争转向长上下文与Agent能力

速览

MiniMax正式发布新一代通用模型M3,采用自研稀疏注意力架构MSA,实现100万token超长上下文窗口及原生多模态支持。该模型在编程、智能体协作及多模态理解等基准测试中表现优异,旨在挑战闭源巨头。同时推出极具价格优势的订阅方案,以开源全能定位抢占企业级市场。

AI 深度解读

背景

6月1日,国产大模型公司 MiniMax 正式发布其新一代通用模型 MiniMax M3。在当前全球大模型竞赛中,随着 Agent(智能体)任务复杂度的不断提升,行业焦点正从单纯的性能指标转向“更长上下文、更稳定记忆、更低成本推理”等决定产品实际可用性的关键维度。MiniMax M3 的发布,旨在通过架构创新与能力突破,挑战由 OpenAI、Google、Anthropic 等巨头主导的闭源模型市场,特别是针对对数据隐私敏感且对智能体性能要求极高的企业级核心客群。

核心内容

MiniMax M3 被定义为国内首个同时具备“前沿 Coding 能力、1M 超长上下文、原生多模态”三项核心能力的大模型,也是目前全球唯一具备完整能力组合的开源选项。其核心突破主要体现在以下几个方面:

1. 架构创新:MiniMax Sparse Attention (MSA) M3 采用了自研的稀疏注意力架构 MiniMax Sparse Attention (MSA)。相较于传统的全注意力机制,MSA 显著降低了长上下文下的计算成本,并将上下文窗口扩展至 100 万 token。在 100 万上下文规模下,M3 的单 token 计算量仅为上一代模型的约 1/20,推理效率大幅提升。此外,MiniMax 在底层推理算子层面进行了优化,通过重新设计数据读取与计算路径,使相关性能较主流开源方案提升 4 倍以上。这使得模型在处理长文档、复杂代码仓库及多轮任务协作时,能在一次推理中保留更完整的信息链路。

2. 能力突破:Coding 与 Agent 能力 在编程与智能体能力上,M3 进行了针对性增强:

  • Coding 能力:在衡量 Coding 能力的 SWE-Bench Pro 基准测试中,MiniMax M3 的表现超过 GPT-5.5 和 Gemini 3.1 Pro,接近 Opus 4.7。
  • 多模态生成:在综合评估 SVG 生成性能的基准 SVG-Bench 上,M3 超过 Opus 4.7。
  • Agent 能力:在多模态测试集 OmniDocBench 上,M3 得分超过 Gemini 3.1 Pro;在面向自主 Agent 的端到端评测框架 Claw-Eval 上,M3 获得最高分。
  • 训练创新:M3 在编程与 Agent 训练中创新引入了交互式用户模拟器框架,通过模拟真实开发者在协作过程中的行为模式,让模型在训练和评测阶段接触更接近生产环境的交互场景。

3. 原生多模态与 Computer Use M3 从训练起点便采用文本、图片、视频等多模态混合训练,并扩展了数据规模和训练管线。模型不仅支持图像与视频理解,还具备桌面操作能力,可在复杂跨应用环境中执行 Computer Use 任务,涵盖办公自动化、企业软件操作及更复杂的生产力场景。

4. 配套产品:MiniMax Code 同日发布的 MiniMax Code 是一款专为 M3 设计并与之一起训练的 Agent 产品。在长程复杂任务中,MiniMax Code 的 Agent Team 能够将大型任务拆解为多阶段、可并发、可动态调整的 Workflow,由 Agent 集群协作推进。

5. 商业化策略 MiniMax 同步推出了极具价格优势的 Token Plan 订阅方案,将使用成本拉入“百元时代”:

  • Plus 版:每月 49 元,提供 6 亿 token。
  • Max 版:每月 119 元,提供 18 亿 token。
  • Ultra 版:每月 469 元,提供 55 亿 token。

关键要点

  • 全球唯一开源组合:MiniMax M3 是全球唯一同时具备前沿 Coding 能力、1M 超长上下文及原生多模态三项核心能力的开源大模型。
  • 计算效率飞跃:通过 MSA 架构和底层算子优化,M3 在 100 万上下文下的单 token 计算量降至上一代的 1/20,推理性能较主流开源方案提升 4 倍以上。
  • 性能对标顶尖闭源模型:在 SWE-Bench Pro、SVG-Bench、OmniDocBench 及 Claw-Eval 等权威基准测试中,M3 的表现超越或接近 GPT-5.5、Gemini 3.1 Pro 及 Opus 4.7 等顶尖闭源模型。
  • 交互式训练框架:引入交互式用户模拟器框架,模拟真实开发者协作行为,显著提升模型在接近生产环境下的交互表现。
  • 端到端执行能力:具备 Computer Use 能力,支持跨应用桌面操作,加速 AI 从感知层向实际执行层的落地。
  • 极致性价比策略:通过订阅制方案(49 元至 469 元/月),以高性价比抢占全球开发者生态,特别是针对对数据隐私敏感的企业级客户。

意义与影响

MiniMax M3 的发布标志着开源大模型在核心能力上对闭源巨头的有力挑战。长期以来,OpenAI、Google 和 Anthropic 等闭源模型垄断了全球最顶尖的逻辑推理、复杂编程和多模态代理能力。MiniMax 通过“开源+全能”的差异化定位,不仅打破了这一垄断局面,更为那些对数据隐私极其敏感、同时要求极高智能体性能的企业级核心客群提供了可行的替代方案。

此外,M3 在长上下文处理效率和 Agent 任务拆解协作上的突破,预示着 AI 进入实际执行层的速度正在明显加快。无论是办公自动化还是复杂的生产力场景,具备完整能力组合且成本可控的开源模型,有望加速 AI 技术在企业级应用中的普及与深化,重塑全球大模型市场的竞争格局。

查看原文 →tmtpost.com