AI 资讯量子位·3 小时前

国产实现4B认知模型端侧部署，效果比肩GPT-5.4

原标题：仅4B大小可端侧部署！卡帕西预言的「认知模型」被国产做出来了

速览

国产团队成功研发出仅4B参数的认知模型，并实现端侧部署。该模型在性能上比肩GPT-5.4，验证了卡帕西关于认知模型的预言。这一突破标志着国产AI在轻量化与高性能方面取得重要进展。

AI 深度解读

背景

近期，OpenAI 创始成员卡帕西（Ilya Sutskever）在访谈中提出一个极具前瞻性的判断：“推理模型要变天了！”他指出，仅需约 10 亿参数即可构建出优秀的「认知核心」——一种剥离了海量事实记忆、仅保留思考算法的智能单元。这一观点揭示了行业对当前大模型发展路径的反思：传统的“Scaling 定律”（即参数越大、知识越多、模型越聪明）正陷入困境。

现有的知识型推理模型虽然能解决复杂的数学和编程问题，但在细节逻辑（如简单的计数陷阱）和长程任务中容易出错，且算力成本高昂，导致 Token 账单激增，甚至迫使亚马逊等大厂紧急关停内部 AI 排行榜以控制预算。行业共识逐渐转向：知识本身已不再稀缺，关键在于模型如何组织、运用知识以及建立知识间的关联。在此背景下，由「小冰之父」李笛领衔的 AI 初创公司 Nextie（明日新程），推出了行业首个认知模型「新程 Alpha」，以仅 4B 参数的轻量级规模，实现了比肩 GPT-5.4 的效果，并支持端侧部署。

核心内容

1. 认知模型 vs. 知识型模型：本质区别 传统的大模型主要依赖庞大的知识库进行检索和回答，属于“死记硬背”模式。而认知模型的核心在于具备自主思考和规划能力，能够将单一场景下的思维策略泛化到不相关的领域。这类似于围棋九段选手不仅背诵棋谱，更理解博弈本质，从而能举一反三。认知模型旨在剥离非必要的知识记忆，凝练出轻量、可泛化、低成本的“思考算法”。

2. 新程 Alpha 的技术路径与训练方法 Nextie 团队采取了独特的训练策略：

数据源选择：摒弃互联网上的噪声数据，转而梳理从 1800 年到 2020 年跨越 220 年的人类学术论文，从中归纳群体智能的演化脉络。
评估维度：基于对人类社会决策过程（辩论、反思、挑战、投票）的深度拆解，提出了五个评估维度：视角完备性、隐含诉求满足度、辩证深度、落地实操性和决策可解释性。
训练方式：在已有的开源推理模型基础上进行强化学习，解耦知识与认知。目标是强化模型的泛化和抽象能力，而非单纯增加参数量。

3. 性能表现与部署优势

效果比肩旗舰：在群体智能任务中，4B 参数的新程 Alpha 输出效果等效于 GPT-5.4 等大参数模型。
端侧部署能力：4B 参数被视为“黄金尺寸”，既足以承载复杂思考算法，又小到可在苹果 MacBook、具身智能设备等端侧直接运行。
成本极低：从云端烧显卡转变为本地交电费，算力成本断崖式下降，用户无需再为高昂的 Token 账单发愁。

4. 团队背景与技术积累 Nextie 核心团队来自微软小冰原班人马，包括创始人李笛（微软亚洲工程院前常务副院长）、曾敏（小冰联合创始人）和王文斓（小冰前大模型与算法负责人）。团队长期致力于解决“智能体协作”问题：

小冰时代：解决单个智能体的对话工程化与大规模用户验证。
Nextie 时代：升级为“一群智能体怎么聊天”，即 Harness 群体多智能体赛道。
技术延续：团队此前推出的“小冰链”（X-CoTA）已验证了透明思维链的价值；2023 年底，团队曾用 3.6B 模型击败 Meta 65B Llama，证明了“小参数+高质量架构”路线的有效性。

关键要点

范式转移：AI 进化终点不是更大的单体大模型，而是具备自主规划能力的认知模型。
成本革命：新程 Alpha 实现了算力成本的指数级下降，使 AI 应用从“烧钱”模式转变为“交电费”模式，极大降低了使用门槛。
三大场景解锁：
1. Harness 多智能体决策：认知模型为 Agent 提供统一规划推演能力，提升复杂决策的质量一致性。
2. 端侧低成本运行：4B 模型可在本地设备运行，无需云端依赖，适合家庭机器人等对成本敏感的场景。
3. Proactive（主动式）Agent：由于运行成本极低，Agent 可 7×24 小时不间断自主规划与执行，从被动响应转向主动行动。
行业趋势印证：OpenAI、谷歌 DeepMind 近期均加强对多智能体协作、长期规划等方向的投入，印证了认知模型是推理模型进化的下一站。
资本与市场认可：Nextie 成立仅半年，已完成两轮融资，由创新工场、Atypical Ventures 领投，奇绩创坛跟投，李开复、陆奇等顶级投资人押注，资金储备可支撑未来 3-5 年创新。
未来规划：继新程 Alpha 之后，泛化能力更强的 8B 认知模型正在加速训练中。

意义与影响

新程 Alpha 的发布标志着 AI 行业从“参数规模竞赛”向“认知效率竞赛”的关键转折。

首先，它打破了“大参数等于高智能”的行业迷思，证明了通过优化认知架构和训练数据质量，小模型同样可以具备强大的推理和泛化能力。这不仅降低了 AI 应用的硬件门槛，使得在边缘设备、具身智能设备上部署高级 AI 成为可能，也为解决当前大模型普遍存在的幻觉、逻辑陷阱和高昂算力成本问题提供了切实可行的技术路径。

其次，新程 Alpha 推动了多智能体（Multi-Agent）系统的实用化。通过提供低成本的认知核心，使得大规模、高频率的智能体协作与自主决策在经济上变得可行，从而解锁了从被动响应到主动执行（Proactive）的全新应用场景，如家庭自动化、复杂任务自动化等。

最后，Nextie 的成功实践验证了“认知模型”作为下一代 AI 基础设施的潜力。随着 OpenAI 等巨头也在布局相关方向，认知模型有望成为继大语言模型、Agent 之后的下一个行业焦点，引发 AI 架构、训练方法及应用生态的全面重构。

查看原文 →qbitai.com

国产实现4B认知模型端侧部署，效果比肩GPT-5.4

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐