1B 参数跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自进化,提速 AGI 进程
速览
面壁智能发布全球首个由“AI创造AI”孕育的基座模型MiniCPM5-1B,在Artificial Analysis榜单中小尺寸模型性能第一。该模型依托“Forge Engineering”范式,通过AI自主编写训练框架和治理数据,实现了参数效率的显著提升。其极致的压缩比支持在端侧设备运行,为降低大模型研发成本及加速AGI进程提供了新路径。
AI 深度解读
背景
当前全球 AI 行业在万亿参数的军备竞赛中,正陷入算力受制、高质量数据枯竭以及电力成本飙升的资源消耗战。北美巨头们斥资数十亿美元建设超算中心,试图通过堆砌算力来推动模型能力增长。然而,这种模式面临着物理瓶颈和边际效应递减的挑战。
在此背景下,面壁智能(Wallbox Intelligence)提出了一种绕开物理瓶颈的新路径:从底层改变研发模式,大幅压缩每一代模型的迭代成本与周期。其核心理念是“AI 制造 AI”,即让 AI 接管编码和框架优化,激活“递归自我改进”的速率。这一设想呼应了 Andrej Karpathy 提出的“自动研究员”概念,旨在通过让 AI 研发 AI 的速度超越人类研发 AI 的速度,从而大幅缩短通往通用人工智能(AGI)的时间。
2026年5月25日,面壁智能发布了全球首个由“AI 创造 AI”孕育而生的基座模型 MiniCPM5-1B,标志着这一技术路径从实验室概念走向工业化落地。
核心内容
MiniCPM5-1B 的发布不仅是参数规模的缩小,更是面壁智能重构大模型研发范式的成果。其核心在于提出了“Forge Engineering”(锻造工程)范式,通过“模型、框架、数据”三驾马车并驾齐驱,实现了“AI 制造 AI”的闭环。
1. 模型性能与端侧优势 MiniCPM5-1B 是一款 1B 参数规模的基座模型,但在性能上表现出“越级”能力:
- 综合性能领先:在国际权威第三方评测机构 Artificial Analysis (AA) 的最新榜单中,MiniCPM5-1B 在「小尺寸模型」榜单中位列第一,是全球 2B 参数规模以内最强的开源基座模型。它仅凭一半的参数量,便超越了 3 个月前的主流 2B 级别模型。
- 专项能力突出:在 LCB-Pro 25Q2 (Easy) 代码能力测评中得分 22.68;在 AIME-2025/2026 数学推理测试中得分 40.42。
- 极致压缩与部署:模型支持 CPU 和浏览器运行,FP16 精度下占用约 2GB 内存,INT4/Q4 量化下仅占 0.5GB 且几乎无损。这极大降低了部署门槛,使其能轻松运行于日常设备,实现“赛博桌宠”或端侧全能助手的应用场景。
2. Forge Engineering:AI 制造 AI 的工业化流水线 Forge Engineering 是面壁智能提出的全新软件工程范式,旨在解决传统大模型训练依赖人工手写代码的生理极限。其核心组件包括:
-
算力/Infra 层:ForgeTrain 框架
- ForgeTrain 被描述为“AI 版 Megatron”,是目前已知首个完全由 AI 编写、并成功训练出工业生产级模型(MiniCPM5-1B)的大模型训练框架。
- 它改变了传统通用框架的逻辑,当 AI 生成代码成本趋近于零时,系统可根据特定硬件(如华为昇腾 910B 或英伟达 H100)“按需生成”专用的极致优化代码。
- 工程实效:在零人工代码介入下,ForgeTrain 在华为昇腾系列上仅耗时 3-5 天跑通适配;在英伟达 H100 上,其生成的纯 AI 代码训练速度超越标杆 Megatron 10%,等效降低 10% 算力成本。
-
数据层:L0-L4 分级数据治理框架
- 面壁智能与清华大学、OpenBMB 联合推出了模型驱动的分层数据管理框架,摒弃传统粗放式清洗,通过“人类定义标准、AI 执行操作”将数据分为五级。
- L1/L2:基础清洗、去重及特定任务筛选。
- L3(关键阶段):AI 自主择数,对海量网页与数学语料进行系统性编辑与合成,识别更接近第一性原理的数据。实验显示,使用 L3 数据训练的模型比使用 L1 数据的模型数学能力提升 7.06pp,且该提升可跨域迁移。
- L4:转化为可验证的结构化知识,支持 RAG 系统。
- 开源贡献:基于此流程,团队开源了 Ultra-Fineweb-zh-L3 数据集,包含超 1T Tokens(中文约 410B Tokens),是开源社区中规模最大的中文预训练合成数据集之一。
-
算法/模型层:自进化飞轮
- 更强大的基座模型具备更强的代码生成和数据理解能力,能利用 ForgeTrain 生成更优框架,并从语料中筛选更高质量数据。
- 由此形成“模型越强 → 框架与数据越优 → 下一代模型更强”的递归闭环,面壁智能正据此向自改进的 L4 阶段发起冲锋。
3. 突破异构计算瓶颈 在英伟达 CUDA 生态占据主导的背景下,国产芯片(如华为昇腾)面临适配难题。传统编译器依赖人类专家,难以覆盖海量组合;而早期的 AI 自动写代码方法(如局部功能生成)易导致系统冲突。ForgeTrain 通过限定范围、明确目标、自动验证的范式,成功补齐了工业级落地的拼图,有望重写昇腾底层软件栈,实现底层软件解耦。
关键要点
- 发布里程碑:2026年5月25日,面壁智能发布 MiniCPM5-1B,这是全球首个由“AI 创造 AI”孕育而生的基座模型。
- 性能表现:MiniCPM5-1B 在 Artificial Analysis 小尺寸模型榜单中排名第一,以 1B 参数超越主流 2B 模型,验证了“智能密度约每 3.5 个月翻一番”的行业定律。
- Forge Engineering 范式:重构软件工程逻辑,让 AI 针对特定硬件动态生成专属最优算子与分布式策略,实现“按需生成”而非长期维护通用框架。
- ForgeTrain 框架:
- 首个完全由 AI 编写并成功训练生产级模型的训练框架。
- 在华为昇腾上实现 3-5 天快速适配,在英伟达 H100 上训练速度超越 Megatron 10%。
- 数据治理创新:
- 提出 L0-L4 分级数据治理框架,其中 L3 阶段通过 AI 自主合成数据,显著提升模型数学及通用推理能力。
- 开源 Ultra-Fineweb-zh-L3 数据集(超 1T Tokens),解决高质量数据枯竭痛点。
- 端侧部署能力:模型支持 CPU 和浏览器运行,INT4 量化下仅需 0.5GB 内存,极大降低了端侧应用开发门槛。
- 生态突围意义:通过 AI 自动生成底层优化代码,为中国 AI 产业提供了一条绕过英伟达 CUDA 生态壁垒、适配国产异构芯片的非线性突围路径。
意义与影响
1. 加速 AGI 进程与研发范式转移 MiniCPM5-1B 的发布标志着 AI 研发从“人力密集型”向“自动化递归改进”转变。通过让 AI 接管底层框架编写和数据筛选,面壁智能证明了“AI 研发 AI 的速度”可以超越人类,这将大幅缩短通往 AGI 的时间,并降低大模型迭代的边际成本。
2. 解决国产芯片适配难题,构建自主生态 在英伟达 CUDA 生态构成高壁垒的背景下,面壁智能的 ForgeTrain 提供了一种新的解决方案。它不依赖人类专家手动优化,而是通过 AI 自动生成适配特定硬件(如华为昇腾)的代码。这不仅解决了“国产卡难用”的工程瓶颈,更在战略层面为中国 AI 产业提供了底层软件解耦
