← 返回信息流
Agent SkillLINUX DO · AI·1 小时前

用户吐槽Claude GPT等模型语言风格倒退

原标题:所有模型语言能力都在倒退?Claude Opus4.6和Opus4.8的语言风格差距也太大了吧!

速览

有用户指出Claude Opus 4.6与4.8等版本间语言风格差异巨大,且普遍存在“稳稳接住”等令人不适的语癖。该现象被认为源于各大模型厂商将重心押注于Agentic和Coding能力,导致基础自然语言交互质量下降。除GLM-5.1外,GPT、Claude及DeepSeek等主流模型均被指语言能力大幅倒退。

AI 深度解读

背景

近期,大语言模型(LLM)在编程(Coding)和智能体(Agentic)能力上取得了显著进展,但与此同时,用户普遍感受到模型在基础自然语言处理能力上的退化。这一现象在 Linux DO 社区的 AI 讨论区引发了热烈反响。

用户观察到,包括 GPT、Claude 和 Deepseek 在内的主流模型,其回复风格中充斥着大量程式化、机械化的“黑话”和语癖。相比之下,仅有 GLM5.1 被指出在语言能力上有所进步。这种退化不仅影响了人机交互的体验,甚至让用户产生了“怀疑是否还认识中文”的疏离感。

核心内容

该讨论由一位用户发起,核心痛点在于模型语言风格的剧烈倒退。

  1. 具体案例对比: 用户指出,Claude 的 Opus 系列模型在不同版本间存在巨大的风格差异。特别是 Opus 4.6 与 Opus 4.8 之间,虽然两者都可用于编程任务,但在日常对话或通用问答场景下,Opus 4.8 的回复风格让用户感到极度不适。这种风格上的断层让用户直观地感受到了模型在语言自然度上的倒退。

  2. 普遍存在的“语癖”与“黑话”: 用户列举了当前主流模型(点名 GPT、Claude、Deepseek)回复中常见的令人反感的固定句式,包括但不限于:

    • “稳稳接住”
    • “一句话总结”
    • “堵住”
    • “按住”
    • “先…否则后面…”
    • “逐条拆解”
    • “赌”

    这些词汇和句式高频出现,使得回复显得僵硬、做作,缺乏自然交流的温度。

  3. 跨平台现象: 这种语言退化并非局限于 AI 模型本身。用户提到,在 Bilibili(B站)等视频平台上,大量的视频脚本也充斥着类似的“黑话”和语癖,导致观众产生强烈的出戏感,就像在阅读小说时突然看到“投石”或“指尖泛白”这类刻意堆砌的描写一样,瞬间破坏了沉浸感。

  4. 用户诉求: 用户并不否认模型在逻辑推理、代码生成等硬技能上的提升,但强调 AI 最终是与人交互的工具。如果语言能力持续拉胯,将严重影响用户体验。因此,用户迫切寻求一种提示词(Prompt),能够有效遏制模型的语言语癖和黑话,恢复自然、流畅的中文表达。

  5. 例外情况: 在对比中,用户特别指出 GLM5.1 是唯一一个在语言能力上表现出进步趋势的模型,这与其它主流模型的倒退形成了鲜明对比。

关键要点

  • 能力与风格的背离:模型在 Agentic(智能体)和 Coding(编程)领域的押注,似乎以牺牲基础语言自然度为代价,导致“语言能力大幅倒退”。
  • 风格退化具有普遍性:GPT、Claude、Deepseek 等头部模型均被用户指出存在严重的语言风格问题,而非个别现象。
  • 特定版本差异显著:以 Claude Opus 系列为例,从 4.6 到 4.8 版本,语言风格发生了剧烈变化,且新版本风格更受用户诟病。
  • 社会文化渗透:AI 生成的“黑话”正在反向渗透至人类内容创作领域(如 B站视频脚本),形成了一种令人不适的机械化表达潮流。
  • 用户体验受损:程式化的回复(如“逐条拆解”、“稳稳接住”)让用户感到恼火,甚至产生认知隔阂,认为这种表达“真的能这样用吗”。
  • GLM5.1 的逆势增长:在主流模型语言退步的背景下,GLM5.1 被用户视为语言能力进步的少数正面案例。
  • 解决方案需求:社区急需通过提示词工程(Prompt Engineering)来约束模型行为,去除冗余语癖,回归自然对话。

意义与影响

  1. 对模型评估体系的反思: 当前对大模型的评估往往侧重于逻辑推理、代码生成等“硬指标”,而忽视了自然语言生成的流畅度、自然度和情感共鸣等“软指标”。此次讨论表明,用户对于模型“像人一样说话”的能力有着极高的期待和敏感度,语言风格的退化可能成为阻碍 AI 大规模普及的隐形门槛。

  2. 提示词工程的新方向: 用户寻求“遏制语癖”的提示词,标志着提示词工程从“激发能力”向“规范风格”延伸。未来的提示词模板可能需要包含更多的“负向约束”(Negative Constraints),明确禁止使用特定词汇和句式,以维持对话的自然性。

  3. 内容生态的警示: AI 生成的机械化语言正在污染人类的内容创作生态。如果 B站等平台的脚本也普遍采用此类“黑话”,将导致整体内容质量的同质化和低质化。这提醒内容创作者在使用 AI 辅助时,必须进行深度的人工润色和风格校准,避免被模型的语癖同化。

  4. 竞争格局的潜在变化: GLM5.1 在语言能力上的突出表现,可能成为其区别于其他竞争对手的一个差异化卖点。在用户日益重视交互体验的背景下,谁能更好地保留自然语言的魅力,谁就可能赢得更多注重体验的用户群体。

  5. 人机交互的伦理与设计: 模型语言风格的退化反映了训练数据中可能存在的偏差,或是为了追求效率而牺牲了多样性。这引发了关于 AI 设计哲学的思考:在追求功能强大的同时,如何确保 AI 保持对人类语言文化的尊重和自然表达的能力,是开发者必须面对的挑战。

查看原文 →linux.do