← 返回信息流
AI 资讯量子位·3 小时前

国产实现4B认知模型端侧部署,效果比肩GPT-5.4

原标题:仅4B大小可端侧部署!卡帕西预言的「认知模型」被国产做出来了

速览

国产团队成功研发出仅4B参数的认知模型,并实现端侧部署。该模型在性能上比肩GPT-5.4,验证了卡帕西关于认知模型的预言。这一突破标志着国产AI在轻量化与高性能方面取得重要进展。

AI 深度解读

背景

近期,OpenAI 创始成员卡帕西(Ilya Sutskever)在访谈中提出一个极具前瞻性的判断:“推理模型要变天了!”他指出,仅需约 10 亿参数即可构建出优秀的「认知核心」——一种剥离了海量事实记忆、仅保留思考算法的智能单元。这一观点揭示了行业对当前大模型发展路径的反思:传统的“Scaling 定律”(即参数越大、知识越多、模型越聪明)正陷入困境。

现有的知识型推理模型虽然能解决复杂的数学和编程问题,但在细节逻辑(如简单的计数陷阱)和长程任务中容易出错,且算力成本高昂,导致 Token 账单激增,甚至迫使亚马逊等大厂紧急关停内部 AI 排行榜以控制预算。行业共识逐渐转向:知识本身已不再稀缺,关键在于模型如何组织、运用知识以及建立知识间的关联。在此背景下,由「小冰之父」李笛领衔的 AI 初创公司 Nextie(明日新程),推出了行业首个认知模型「新程 Alpha」,以仅 4B 参数的轻量级规模,实现了比肩 GPT-5.4 的效果,并支持端侧部署。

核心内容

1. 认知模型 vs. 知识型模型:本质区别 传统的大模型主要依赖庞大的知识库进行检索和回答,属于“死记硬背”模式。而认知模型的核心在于具备自主思考和规划能力,能够将单一场景下的思维策略泛化到不相关的领域。这类似于围棋九段选手不仅背诵棋谱,更理解博弈本质,从而能举一反三。认知模型旨在剥离非必要的知识记忆,凝练出轻量、可泛化、低成本的“思考算法”。

2. 新程 Alpha 的技术路径与训练方法 Nextie 团队采取了独特的训练策略:

  • 数据源选择:摒弃互联网上的噪声数据,转而梳理从 1800 年到 2020 年跨越 220 年的人类学术论文,从中归纳群体智能的演化脉络。
  • 评估维度:基于对人类社会决策过程(辩论、反思、挑战、投票)的深度拆解,提出了五个评估维度:视角完备性、隐含诉求满足度、辩证深度、落地实操性和决策可解释性。
  • 训练方式:在已有的开源推理模型基础上进行强化学习,解耦知识与认知。目标是强化模型的泛化和抽象能力,而非单纯增加参数量。

3. 性能表现与部署优势

  • 效果比肩旗舰:在群体智能任务中,4B 参数的新程 Alpha 输出效果等效于 GPT-5.4 等大参数模型。
  • 端侧部署能力:4B 参数被视为“黄金尺寸”,既足以承载复杂思考算法,又小到可在苹果 MacBook、具身智能设备等端侧直接运行。
  • 成本极低:从云端烧显卡转变为本地交电费,算力成本断崖式下降,用户无需再为高昂的 Token 账单发愁。

4. 团队背景与技术积累 Nextie 核心团队来自微软小冰原班人马,包括创始人李笛(微软亚洲工程院前常务副院长)、曾敏(小冰联合创始人)和王文斓(小冰前大模型与算法负责人)。团队长期致力于解决“智能体协作”问题:

  • 小冰时代:解决单个智能体的对话工程化与大规模用户验证。
  • Nextie 时代:升级为“一群智能体怎么聊天”,即 Harness 群体多智能体赛道。
  • 技术延续:团队此前推出的“小冰链”(X-CoTA)已验证了透明思维链的价值;2023 年底,团队曾用 3.6B 模型击败 Meta 65B Llama,证明了“小参数+高质量架构”路线的有效性。

关键要点

  • 范式转移:AI 进化终点不是更大的单体大模型,而是具备自主规划能力的认知模型。
  • 成本革命:新程 Alpha 实现了算力成本的指数级下降,使 AI 应用从“烧钱”模式转变为“交电费”模式,极大降低了使用门槛。
  • 三大场景解锁
    1. Harness 多智能体决策:认知模型为 Agent 提供统一规划推演能力,提升复杂决策的质量一致性。
    2. 端侧低成本运行:4B 模型可在本地设备运行,无需云端依赖,适合家庭机器人等对成本敏感的场景。
    3. Proactive(主动式)Agent:由于运行成本极低,Agent 可 7×24 小时不间断自主规划与执行,从被动响应转向主动行动。
  • 行业趋势印证:OpenAI、谷歌 DeepMind 近期均加强对多智能体协作、长期规划等方向的投入,印证了认知模型是推理模型进化的下一站。
  • 资本与市场认可:Nextie 成立仅半年,已完成两轮融资,由创新工场、Atypical Ventures 领投,奇绩创坛跟投,李开复、陆奇等顶级投资人押注,资金储备可支撑未来 3-5 年创新。
  • 未来规划:继新程 Alpha 之后,泛化能力更强的 8B 认知模型正在加速训练中。

意义与影响

新程 Alpha 的发布标志着 AI 行业从“参数规模竞赛”向“认知效率竞赛”的关键转折。

首先,它打破了“大参数等于高智能”的行业迷思,证明了通过优化认知架构和训练数据质量,小模型同样可以具备强大的推理和泛化能力。这不仅降低了 AI 应用的硬件门槛,使得在边缘设备、具身智能设备上部署高级 AI 成为可能,也为解决当前大模型普遍存在的幻觉、逻辑陷阱和高昂算力成本问题提供了切实可行的技术路径。

其次,新程 Alpha 推动了多智能体(Multi-Agent)系统的实用化。通过提供低成本的认知核心,使得大规模、高频率的智能体协作与自主决策在经济上变得可行,从而解锁了从被动响应到主动执行(Proactive)的全新应用场景,如家庭自动化、复杂任务自动化等。

最后,Nextie 的成功实践验证了“认知模型”作为下一代 AI 基础设施的潜力。随着 OpenAI 等巨头也在布局相关方向,认知模型有望成为继大语言模型、Agent 之后的下一个行业焦点,引发 AI 架构、训练方法及应用生态的全面重构。

查看原文 →qbitai.com