AI 资讯雷峰网·6 天前

1B 参数跑出 2B 性能？面壁 MiniCPM5-1B 用 AI 自进化，提速 AGI 进程

速览

面壁智能发布全球首个由“AI创造AI”孕育的基座模型MiniCPM5-1B，在Artificial Analysis榜单中小尺寸模型性能第一。该模型依托“Forge Engineering”范式，通过AI自主编写训练框架和治理数据，实现了参数效率的显著提升。其极致的压缩比支持在端侧设备运行，为降低大模型研发成本及加速AGI进程提供了新路径。

AI 深度解读

背景

当前全球 AI 行业在万亿参数的军备竞赛中，正陷入算力受制、高质量数据枯竭以及电力成本飙升的资源消耗战。北美巨头们斥资数十亿美元建设超算中心，试图通过堆砌算力来推动模型能力增长。然而，这种模式面临着物理瓶颈和边际效应递减的挑战。

在此背景下，面壁智能（Wallbox Intelligence）提出了一种绕开物理瓶颈的新路径：从底层改变研发模式，大幅压缩每一代模型的迭代成本与周期。其核心理念是“AI 制造 AI”，即让 AI 接管编码和框架优化，激活“递归自我改进”的速率。这一设想呼应了 Andrej Karpathy 提出的“自动研究员”概念，旨在通过让 AI 研发 AI 的速度超越人类研发 AI 的速度，从而大幅缩短通往通用人工智能（AGI）的时间。

2026年5月25日，面壁智能发布了全球首个由“AI 创造 AI”孕育而生的基座模型 MiniCPM5-1B，标志着这一技术路径从实验室概念走向工业化落地。

核心内容

MiniCPM5-1B 的发布不仅是参数规模的缩小，更是面壁智能重构大模型研发范式的成果。其核心在于提出了“Forge Engineering”（锻造工程）范式，通过“模型、框架、数据”三驾马车并驾齐驱，实现了“AI 制造 AI”的闭环。

1. 模型性能与端侧优势 MiniCPM5-1B 是一款 1B 参数规模的基座模型，但在性能上表现出“越级”能力：

综合性能领先：在国际权威第三方评测机构 Artificial Analysis (AA) 的最新榜单中，MiniCPM5-1B 在「小尺寸模型」榜单中位列第一，是全球 2B 参数规模以内最强的开源基座模型。它仅凭一半的参数量，便超越了 3 个月前的主流 2B 级别模型。
专项能力突出：在 LCB-Pro 25Q2 (Easy) 代码能力测评中得分 22.68；在 AIME-2025/2026 数学推理测试中得分 40.42。
极致压缩与部署：模型支持 CPU 和浏览器运行，FP16 精度下占用约 2GB 内存，INT4/Q4 量化下仅占 0.5GB 且几乎无损。这极大降低了部署门槛，使其能轻松运行于日常设备，实现“赛博桌宠”或端侧全能助手的应用场景。

2. Forge Engineering：AI 制造 AI 的工业化流水线 Forge Engineering 是面壁智能提出的全新软件工程范式，旨在解决传统大模型训练依赖人工手写代码的生理极限。其核心组件包括：

算力/Infra 层：ForgeTrain 框架
- ForgeTrain 被描述为“AI 版 Megatron”，是目前已知首个完全由 AI 编写、并成功训练出工业生产级模型（MiniCPM5-1B）的大模型训练框架。
- 它改变了传统通用框架的逻辑，当 AI 生成代码成本趋近于零时，系统可根据特定硬件（如华为昇腾 910B 或英伟达 H100）“按需生成”专用的极致优化代码。
- 工程实效：在零人工代码介入下，ForgeTrain 在华为昇腾系列上仅耗时 3-5 天跑通适配；在英伟达 H100 上，其生成的纯 AI 代码训练速度超越标杆 Megatron 10%，等效降低 10% 算力成本。
数据层：L0-L4 分级数据治理框架
- 面壁智能与清华大学、OpenBMB 联合推出了模型驱动的分层数据管理框架，摒弃传统粗放式清洗，通过“人类定义标准、AI 执行操作”将数据分为五级。
- L1/L2：基础清洗、去重及特定任务筛选。
- L3（关键阶段）：AI 自主择数，对海量网页与数学语料进行系统性编辑与合成，识别更接近第一性原理的数据。实验显示，使用 L3 数据训练的模型比使用 L1 数据的模型数学能力提升 7.06pp，且该提升可跨域迁移。
- L4：转化为可验证的结构化知识，支持 RAG 系统。
- 开源贡献：基于此流程，团队开源了 Ultra-Fineweb-zh-L3 数据集，包含超 1T Tokens（中文约 410B Tokens），是开源社区中规模最大的中文预训练合成数据集之一。
算法/模型层：自进化飞轮
- 更强大的基座模型具备更强的代码生成和数据理解能力，能利用 ForgeTrain 生成更优框架，并从语料中筛选更高质量数据。
- 由此形成“模型越强 → 框架与数据越优 → 下一代模型更强”的递归闭环，面壁智能正据此向自改进的 L4 阶段发起冲锋。

3. 突破异构计算瓶颈 在英伟达 CUDA 生态占据主导的背景下，国产芯片（如华为昇腾）面临适配难题。传统编译器依赖人类专家，难以覆盖海量组合；而早期的 AI 自动写代码方法（如局部功能生成）易导致系统冲突。ForgeTrain 通过限定范围、明确目标、自动验证的范式，成功补齐了工业级落地的拼图，有望重写昇腾底层软件栈，实现底层软件解耦。

关键要点

发布里程碑：2026年5月25日，面壁智能发布 MiniCPM5-1B，这是全球首个由“AI 创造 AI”孕育而生的基座模型。
性能表现：MiniCPM5-1B 在 Artificial Analysis 小尺寸模型榜单中排名第一，以 1B 参数超越主流 2B 模型，验证了“智能密度约每 3.5 个月翻一番”的行业定律。
Forge Engineering 范式：重构软件工程逻辑，让 AI 针对特定硬件动态生成专属最优算子与分布式策略，实现“按需生成”而非长期维护通用框架。
ForgeTrain 框架：
- 首个完全由 AI 编写并成功训练生产级模型的训练框架。
- 在华为昇腾上实现 3-5 天快速适配，在英伟达 H100 上训练速度超越 Megatron 10%。
数据治理创新：
- 提出 L0-L4 分级数据治理框架，其中 L3 阶段通过 AI 自主合成数据，显著提升模型数学及通用推理能力。
- 开源 Ultra-Fineweb-zh-L3 数据集（超 1T Tokens），解决高质量数据枯竭痛点。
端侧部署能力：模型支持 CPU 和浏览器运行，INT4 量化下仅需 0.5GB 内存，极大降低了端侧应用开发门槛。
生态突围意义：通过 AI 自动生成底层优化代码，为中国 AI 产业提供了一条绕过英伟达 CUDA 生态壁垒、适配国产异构芯片的非线性突围路径。

意义与影响

1. 加速 AGI 进程与研发范式转移 MiniCPM5-1B 的发布标志着 AI 研发从“人力密集型”向“自动化递归改进”转变。通过让 AI 接管底层框架编写和数据筛选，面壁智能证明了“AI 研发 AI 的速度”可以超越人类，这将大幅缩短通往 AGI 的时间，并降低大模型迭代的边际成本。

2. 解决国产芯片适配难题，构建自主生态 在英伟达 CUDA 生态构成高壁垒的背景下，面壁智能的 ForgeTrain 提供了一种新的解决方案。它不依赖人类专家手动优化，而是通过 AI 自动生成适配特定硬件（如华为昇腾）的代码。这不仅解决了“国产卡难用”的工程瓶颈，更在战略层面为中国 AI 产业提供了底层软件解耦

查看原文 →leiphone.com

1B 参数跑出 2B 性能？面壁 MiniCPM5-1B 用 AI 自进化，提速 AGI 进程

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐