← 返回信息流
AI 资讯量子位·2 小时前

国产通用大模型第一梯队迎新军?不卷参数卷智能密度

原标题:国产通用大模型第一梯队,来新人了?!

速览

国产通用大模型第一梯队迎来新竞争者,标志着行业进入新阶段。该模型不再单纯追求参数规模的扩张,而是聚焦于提升“智能密度”与“Token价值”。这一转变意味着大模型竞争正从粗放的数量堆砌转向精细化的质量与效率比拼。

AI 深度解读

背景

当前国产通用大模型领域,行业长期遵循“堆参数、堆算力”的主流路径。尽管“大力出奇迹”让模型能力显著提升,但在进入推理时代和 Agent(智能体)时代后,这一模式的弊端日益凸显。为了让模型具备深度思考能力,主流做法是将思维链逐 Token 展开,导致 Token 消耗激增。

这种高成本传导至企业端,造成盈利困难;传导至用户端,则引发“Token 不够用、用不起”的焦虑。在竞争格局看似收敛的当下,港股 AGI 第一股云知声带着新一代基座模型 U2 闯入第一梯队。U2 不走传统老路,而是提出“智能密度 × Token 价值”的新理念,试图在降低推理成本的同时保持甚至超越超大模型的性能,解决行业痛点。

核心内容

云知声发布的 U2 模型被定义为“原生智能体模型”,其核心设计理念是最大化单位 Token 的智能产出。U2 在多项关键评测中,以极低的激活参数规模比肩甚至超越体量大得多的竞争对手,思考 Token 消耗量减少约 25%,推理成本显著降低。

1. 能力实测:以小胜大,全能表现 U2 在 IFBench 指令遵循、Claw 系列 Agent 评测及 GDPval 办公能力评测中表现优异,完成复杂任务的交互轮次更少。在 GPQA 硬核推理和长文本理解上,凭借极低激活参数打出接近或超过部分超大模型的效果。

  • Vibe Coding 能力:在无约束条件下,U2 能生成生产级的前端代码(如交互式粒子宇宙),无需外部依赖,展示高上限的编码能力。
  • Agent 开发能力:在模糊需求下,U2 能一次性完成多模块应用开发(如 12 星座意图分析应用),具备多步规划和工具调用能力。
  • 推理与研究深度:零资料输入下,U2 能输出结构完整、数据有据可查的深度行业报告,展现强大的逻辑推理能力。

2. 技术实现:数据与架构的双重优化 U2 之所以能做到“小参数、强能力、少 Token”,主要得益于以下工程优化:

  • 数据层面
    • 高知识密度精筛:过滤重复、低质及易诱发幻觉的数据,提升单位参数的有效知识密度。
    • 语义 Token 压缩:优化分词与表征,让每个 Token 承载更多有效信息。
    • 幻觉抑制:设置知识点级校验与自反馈机制,持续纠偏。
  • 架构层面
    • 稀疏 MoE(混合专家)结构:结合稀疏知识编码和知识蒸馏,对专家进行精炼提纯,实现“能省则省”,避免专家臃肿导致的算力浪费。U2 凭借 2660 亿参数达到了 1.2 万亿参数模型的性能,参数效率接近后者的 5 倍。
  • 推理优化
    • 隐式思考机制:借鉴人脑解题方式,在隐藏层先理清解题方向,再进入显式推理,大量中间过程无需展开为 Token 输出。
    • 精简推理路径:砍掉无效步骤和冗余推导,将思考 Token 消耗减少约 25%。
  • 原生 Agent 闭环:将原生 Agent 能力与 Harness Engineering 放入同一训练闭环,模型利用真实任务数据强化规划与纠错能力,使 Agent 能力“原生长”而非后天外挂,进一步降低交互轮次和 Token 成本。

3. 商业逻辑:Token 经济学 云知声创始人黄伟指出,2023-2025 年是热身赛,2026 年正赛才开始,竞争标准从“资源投入”转向“价值创造”。云知声的定位是“原生智能体基座大模型公司”,其积累源于从语音识别到理解“声音背后意识”的长期演进。

  • 商业模式闭环:底层 U2 基座模型 -> 中间兽牙智能体平台 -> 上层连接医疗、医保、交通等产业场景及开发者。
  • 财务验证:云知声年营收超 10 亿元,大模型相关收入突破 6.1 亿元,同比增长超 10 倍。Token 调用收入 ARR 环比增长 600%,证明其收入与客户创造的 AI 价值直接挂钩。

关键要点

  • 新竞争标准:大模型竞争从“拼参数规模”转向“拼智能密度与 Token 价值”,U2 是这一范式转变的代表。
  • 性能突破:U2 以 2660 亿激活参数达到 1.2 万亿参数模型的性能水平,参数效率提升近 5 倍。
  • 成本降低:通过隐式思考机制和推理路径精简,U2 将思考 Token 消耗减少约 25%,显著降低企业级长链路任务的推理成本。
  • 原生智能体:U2 并非外挂 Agent 能力,而是通过训练闭环实现原生智能体能力,具备更强的多步规划、工具调用和过程纠错能力。
  • 数据驱动:云知声依托十余年在智慧医疗、智慧生活等真实场景积累的稀缺数据和反馈,形成了“强基模+深应用”的独特方法论。
  • 商业闭环:云知声通过“Token 经济学”实现收入与客户价值挂钩,Token 调用收入高速增长,验证了“智能密度”路线的商业可行性。

意义与影响

U2 的发布及云知声的突围,标志着国产大模型行业进入“后参数时代”。其意义在于:

  1. 重构成本结构:U2 以 1/10 的 Token 成本重构了复杂任务的成本结构,使得许多过去因成本过高而无法大规模部署的 AI 场景具备了落地可能。
  2. 验证新路线可行性:证明了高性能与低成本并非取舍关系,通过优化数据密度、架构效率和推理机制,可以同时实现“智能更密”和“Token 更值”。
  3. 行业评价坐标转移:行业焦点将从“谁的模型更大”逐渐转向“谁的模型更值”。U2 作为这一转变的第一块试金石,为后续大模型发展提供了新的技术路径和商业参考。
  4. 长期主义的价值:云知声的案例表明,在 AI 1.0 时代积累的底层技术和真实场景数据,在 AI 生产力时代具有极高的壁垒价值,长期深耕真实需求的企业将在新一轮竞争中占据优势。
查看原文 →qbitai.com