Agent SkillLINUX DO · AI·1 小时前

用户吐槽Claude Code比Codex笨：响应慢且无视规范

原标题：claude code和codex比对，感觉claude笨，啥原因呢？

速览

有开发者在使用Claude Code时反馈体验不佳，认为其相比Codex显得“笨拙”。主要问题包括消耗速度快、返回响应慢，以及无法严格遵守用户提供的规范文档。Claude Code常被指无视既定规范，强行猜测并调用不存在的方法，导致代码质量混乱。

AI 深度解读

背景

在当前的 AI 辅助开发生态中，开发者对于不同大语言模型（LLM）在代码生成、规范遵循及执行效率上的表现有着极高的关注度。近期，在 LINUX DO 社区的一个关于 AI 技能、提示词及工作流的讨论帖中，一位资深开发者分享了他对 Claude Code 与 Codex 两款工具的实测对比体验。

该用户此前一直依赖 Codex 进行 Java 开发，但在近期尝试使用基于 Claude 模型的 Claude Code 时，遭遇了显著的体验落差。这种落差不仅体现在响应速度和资源消耗上，更体现在模型对既定代码规范的无视以及“幻觉”式编码行为上。这一案例反映了当前 AI 编程助手在实际工程落地中面临的挑战：即模型能力与工程约束之间的对齐问题。

核心内容

该讨论帖的核心内容围绕一位开发者在使用 Claude Code 时遇到的具体痛点展开，并与之前长期使用的 Codex 进行了对比。主要问题集中在以下三个方面：

性能与资源效率问题：用户反馈在使用 Claude Code 时，感觉其“消耗快”且“返回慢”。虽然用户理解这可能与其底层模型的计算特性有关，但这种低效感直接影响了开发流畅度。用户怀疑这可能与初次使用缺乏默认配置有关，但即便排除配置因素，整体体验仍被认为较为“笨拙”。
对规范文档的严重忽视：这是导致用户感到 Claude Code “笨”的核心原因。用户将一份由 Codex 编写的、包含详细编码规范的文档地址提供给 Claude Code，期望其能遵循这些规范生成 Java 代码。然而，Claude Code 生成的代码依然杂乱无章，完全未遵守文档中明确标注的规则。
幻觉式编码与强行调用：用户指出，Claude Code 存在严重的“幻觉”现象。当模型认为某个方法存在时，它会强行使用该方法，即使该方法在规范文档中并未被推荐或根本不存在。这种“认为有就非要使用”的行为，导致生成的 Java 代码不仅不符合规范，甚至可能包含无法编译或逻辑错误的代码片段。相比之下，用户之前使用的 Codex 在遵循规范和生成代码的准确性上表现更为稳定。

关键要点

模型表现差异：在同一开发场景下，Claude Code 在代码规范性遵循和生成准确性上，目前的表现不如用户此前使用的 Codex。
规范遵循失效：即使提供了明确的编码规范文档链接，Claude Code 仍未能有效提取并执行其中的约束，显示出其在长上下文理解或指令遵循（Instruction Following）方面的局限性。
幻觉问题显著：模型倾向于生成看似合理但实际不存在的 API 调用或方法，这种“强行使用”的行为增加了代码审查和修正的成本。
配置与体验关联：用户推测初次使用可能缺乏默认配置影响了体验，但核心问题仍指向模型本身的行为模式，而非单纯的技术配置问题。
开发者信任度转移：由于上述问题，开发者对 Claude Code 的信任度暂时低于 Codex，反映出在专业开发场景中，稳定性和可预测性比单纯的模型参数规模更为重要。

意义与影响

这一案例揭示了当前 AI 编程助手在从“玩具”走向“生产工具”过程中必须跨越的鸿沟：

指令遵循是工程化的基石：对于企业级开发而言，代码规范、架构约束和安全标准是红线。AI 模型如果不能严格遵循这些外部约束，其生成的代码将增加巨大的维护成本和安全隐患。Claude Code 在此处的失败表明，仅靠强大的生成能力不足以胜任严肃的工程任务，必须强化其对上下文和外部文档的精准理解与执行能力。
幻觉控制是核心瓶颈：模型“强行使用不存在的方法”是典型的幻觉问题。在代码生成中，这种幻觉不仅导致编译错误，更可能引入隐蔽的逻辑漏洞。开发者需要意识到，目前的 AI 模型仍需要大量的人工审查（Human-in-the-loop），不能完全自动化地替代资深工程师的代码编写工作。
工具选型需基于实际场景：没有绝对“最好”的模型，只有最适合当前工作流的模型。Codex 在用户特定 Java 项目中的稳定表现，说明不同模型在不同技术栈和提示词工程下的表现差异巨大。开发者应根据具体需求（如速度、准确性、规范遵循度）灵活选择工具，而非盲目追随最新模型的热度。
提示词工程与配置的重要性：用户提到的“默认配置”问题暗示了 AI 工具的使用门槛。如何为特定模型配置最优的 System Prompt、上下文窗口管理以及外部知识库检索（RAG），将是提升 AI 辅助开发效率的关键技能。未来的 AI 开发工作流将更加注重对模型行为的精细调控，而非简单的问答交互。

查看原文 →linux.do

用户吐槽Claude Code比Codex笨：响应慢且无视规范

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐