← 返回信息流
Agent SkillLINUX DO · AI·1 小时前

用户疑智谱Coding Plan限制请求致Hermes频繁429

原标题:智谱coding plan最近开始限制养虾?

速览

有用户反映智谱Coding Plan服务近期出现异常,Hermes模型频繁返回429错误,而Claude Code请求正常。该现象发生在GLM5.2模型上架后,用户推测可能是智谱因算力资源紧张限制了部分请求。此情况反映了大模型服务在高负载下的稳定性挑战。

AI 深度解读

背景

近期,智谱(Zhipu AI)发布了其最新的大语言模型 GLM-5.2。随着新模型的上线,平台的服务负载和调度策略可能发生了显著变化。在 LINUX DO 社区的 AI 板块中,有用户反馈在使用智谱提供的编程辅助工具时,遭遇了严重的服务不稳定问题。具体表现为部分模型接口响应极慢或完全不可用,而另一部分接口则保持正常,这种差异化的服务状态引发了社区对于平台资源分配策略及潜在限制措施的讨论。

核心内容

该帖子的核心内容围绕智谱平台在 GLM-5.2 发布后的服务异常展开。用户通过对比不同编程助手接口的请求日志,发现了一个明显的异常现象:

  1. 整体性能下降:自 GLM-5.2 上架以来,用户普遍感受到平台整体响应速度显著变慢。
  2. 特定接口报错:用户在使用 Hermes 这一编程助手接口时,频繁遭遇服务中断。通过查看后台日志,发现 Hermes 的请求返回了 HTTP 429 状态码。在 HTTP 协议中,429 Too Many Requests 通常表示用户发送了过多的请求,服务器正在实施速率限制(Rate Limiting)或过载保护。
  3. 对比正常接口:与此同时,用户使用的 Claude Code(简称 cc)接口请求则完全正常,未出现类似报错,能够稳定返回结果。
  4. 推测原因:基于上述对比,发帖者推测智谱可能因为算力资源紧张,对 Hermes 接口的请求进行了限制,俗称“限制养虾”(注:“养虾”为社区黑话,通常指代通过脚本或自动化方式持续占用资源的行为,此处引申为对特定高频或自动化请求的限制)。

关键要点

  • 触发事件:智谱发布 GLM-5.2 模型后,平台出现服务波动。
  • 故障现象:Hermes 接口频繁返回 429 错误,导致无法正常使用;而 Claude Code 接口工作正常。
  • 技术细节:429 状态码明确指向请求频率过高或服务器过载保护机制被触发。
  • 社区解读:用户怀疑平台因算力紧张,对 Hermes 接口实施了针对性的速率限制或访问控制。
  • 信息来源:基于 LINUX DO 社区用户的实际测试日志和主观推测,非官方公告。

意义与影响

这一现象反映了当前大模型服务市场中,算力资源紧张与高并发需求之间的矛盾。

  1. 资源调度策略:平台在发布新模型或面临流量高峰时,可能会采取非对称的服务降级策略。优先保障核心模型或特定合作伙伴(如 Claude Code 可能通过不同通道接入)的服务稳定性,而牺牲其他接口的可用性。
  2. 开发者体验:对于依赖 Hermes 等接口进行自动化开发或高频调用的开发者而言,不稳定的服务将直接影响工作效率。429 错误意味着需要重新设计重试机制或调整请求频率,增加了开发成本。
  3. 社区信任度:此类“限制”传闻若未经官方澄清,可能引发社区对平台公平性和透明度的质疑。用户倾向于认为平台在人为制造稀缺性或进行不透明的资源分配。
  4. 行业趋势:随着 GLM-5.2 等新一代模型的推出,各大厂商均在优化推理效率。然而,如何在保证新模型性能的同时,维持旧有接口或第三方集成服务的稳定性,仍是智谱等平台需要解决的关键运营问题。
查看原文 →linux.do