← 返回信息流
AI 资讯量子位·1 小时前

马斯克预测GLM明年Q1追平Fable,智谱唐杰回应没那么久

原标题:马斯克预测GLM明年Q1追平Fable,智谱唐杰:没那么久

速览

马斯克预测智谱GLM模型将于明年第一季度追平Fable。智谱科技创始人唐杰对此回应称,这一预测并不准确,时间不会那么快。这反映了业界对国产大模型发展速度的不同预期。

AI 深度解读

背景

近期,全球AI开源社区 Hugging Face(抱抱脸)做出了一项罕见举动:为智谱刚刚开源的旗舰模型 GLM-5.2 提供连续 6 小时的全球免费算力支持。这是 Hugging Face 首次真金白银地为一款中国模型提供此类资源,且无需申请、不限地区,引发了开发者的广泛关注。

这一动作的背景与一场发生在社交媒体 𝕏(原 Twitter)上的对话密切相关。网友询问 Elon Musk(马斯克)对中国模型达到 Fable 级别(指代 Anthropic 的 Claude Fable 系列)的时间表预测。Musk 预测可能在 2027 年第一季度,但随即智谱创始人兼首席科学家唐杰回复称“用不了那么久”。这一互动不仅展示了中国模型追赶速度的惊人,也恰逢 Anthropic 发布并迅速下线其最强模型 Claude Fable 5 和 Claude Mythos 5 的微妙时间点,使得 GLM-5.2 的开源发布更具象征意义。

核心内容

Hugging Face 的“专属VIP”支持 Hugging Face 自掏腰包,为智谱开源的 GLM-5.2 提供 6 小时全球免费算力。这一举措打破了以往需要申请或受地域限制的模式,旨在降低开发者体验最新前沿模型门槛,体现了社区对 GLM-5.2 技术实力的认可。

Musk 的预测与唐杰的回应 在 𝕏 平台上,针对中国模型何时能追平 Fable 级别模型的问题,Elon Musk 给出了“2027 年一季度”的保守预测。然而,智谱创始人唐杰直接回应“用不了那么久”,并暗示差距正在迅速缩小。这一对话被外界视为 GLM-5.2 当前技术地位的有力佐证。

GLM-5.2 的技术特性与开源策略 GLM-5.2 于 6 月 17 日正式上线,采用 MIT 协议,完全开源并允许免费商用。其核心亮点包括:

  • 长程任务能力:专为长程任务设计,支持可用的 1M(百万)稳定上下文长程编程。
  • IndexShare 机制:提出每四层稀疏注意力共享同一个 indexer 的机制,使模型在百万 token 上下文中的每个 token 计算量降低约 2.9 倍,从而能处理更大的工程代码并记住更多上下文。
  • 开源理念:在 Anthropic 的顶级模型因故下线、引发对“前沿智能是否只属于少数人”的讨论时,GLM-5.2 选择将权重、代码和商业使用权完全开放,强调智能应开放、可用、可构建。

性能表现与基准测试 GLM-5.2 在多项权威基准中表现优异:

  • Code Arena:在全球百万用户参与盲测的前端开发评估系统中,取得全球可用模型第一的表现。
  • Artificial Analysis:综合榜单得分 51 分,跻身全球模型前三,位列开源模型 SOTA(State of the Art)。
  • 代码与长程任务:在 FrontierSWE、Terminal-Bench 等基准上,与国际顶尖闭源模型 Claude Opus 4.8 的差距收窄至 1%–4%,标志着开源模型代码能力首次达到行业认可的顶尖闭源水平。

中国模型的崛起与生态适配 GLM-5.2 的发布是中国 AI 开源模型崛起的缩影。自 DeepSeek-R1 发布以来,中国大模型公司纷纷转向开源,在 OpenRouter 上中国模型的调用量已从 2024 年底的 1.2% 上升至超过 50%。GLM-5.2 不再仅仅是“高性价比平替”,而是冲入了智能体编程和长程复杂任务等核心领域。此外,GLM-5.2 上线首日即完成与华为昇腾、平头哥、摩尔线程、寒武纪等国产算力平台的全适配,构建了全栈开放生态。

关键要点

  • 算力支持创新:Hugging Face 首次为单一中国模型提供无门槛的全球免费算力,彰显社区支持。
  • 技术追赶加速:智谱创始人唐杰否认 Musk 关于“2027 年 Q1 才追平”的预测,暗示中国模型进步速度远超预期。
  • 长程编程突破:GLM-5.2 通过 IndexShare 机制实现百万 token 上下文的高效处理,计算量降低 2.9 倍。
  • 性能对标顶尖:在 Code Arena 获全球可用模型第一,在代码基准上与 Claude Opus 4.8 差距仅 1%-4%,确立开源 SOTA 地位。
  • 开源 vs 封闭:在 Anthropic 顶级模型突然下线的背景下,GLM-5.2 以 MIT 协议完全开源,提供确定性更高的替代方案。
  • 生态全面适配:GLM-5.2 及 DeepSeek V4 等模型已完成对华为昇腾、寒武纪等国产算力平台的全栈适配,推动国产算力生态繁荣。
  • 市场地位转变:中国模型从单纯的“便宜替代”转向前沿能力领先,在 OpenRouter 等平台调用量占比已超 50%。

意义与影响

GLM-5.2 的发布及其引发的讨论,标志着全球大模型竞争格局的重要变化。首先,它打破了“前沿能力只能由少数闭源平台垄断”的传统认知,证明开源模型同样可以达到甚至超越顶级闭源模型的水平,为开发者提供了更开放、可控的选择。

其次,Musk 与唐杰的对话反映了全球市场对中国 AI 前沿模型追赶速度的重新估值。中国开源模型不仅在调用量上占据主导,更在智能体编程、长程复杂任务等高难度领域取得突破,从“追赶者”转变为“竞争者”。

最后,GLM-5.2 与国产算力平台的全栈适配,展示了中国 AI 产业在软硬件协同上的成熟度。这种“来自中国的全栈开放生态”不仅赋能全球开发者,也为实现互利共赢、开放包容的 AI 产业繁荣提供了新的中国方案。

查看原文 →qbitai.com