Agent SkillLINUX DO · AI·2 小时前

Claude Opus 4.8超长上下文出现严重幻觉

原标题：wc？opus4.8你是人啊？幻觉严重成这样了？自问自答

速览

有用户在使用Claude Code时遭遇严重问题，当上下文长度增加时，基于Opus 4.8模型的AI出现严重幻觉，表现为完全不相关的自问自答。尽管官方Max订阅未走中转，但超长上下文下的稳定性表现极差，被指完全不可用。

AI 深度解读

背景

在 AI 编程助手与长上下文处理日益普及的当下，开发者对模型在超长对话窗口下的稳定性提出了更高要求。近期，LINUX DO 社区用户分享了一次关于 Anthropic 旗下旗舰模型 opus4.8（注：此处指代用户所指的特定版本或微调版，通常对应 Claude 系列中的高性能版本）在实际工作流中遭遇严重“幻觉”问题的经历。

该用户在使用基于 opus4.8 的 high 思考模式进行代码辅助工作时，发现当上下文窗口积累到一定长度后，模型出现了严重的逻辑断裂和无关回复。这一现象引发了关于大模型在极端长上下文场景下可靠性、压缩机制差异以及实际生产环境可用性的深入讨论。

核心内容

用户详细描述了一次从正常到异常的工作流崩溃过程。起初，在使用 opus4.8 的 high 思考模式时，模型表现正常，能够准确理解任务并执行。然而，随着对话上下文的不断累积，模型突然出现了“自问自答”的现象，即模型开始生成与当前任务完全无关的内容，甚至在没有触发特定指令的情况下自行发起对话。

为了排查问题，用户检查了浏览器登录状态及飞书聊天机器人的兜底逻辑，确认前端交互和中间件均正常运行。在排除外部干扰后，用户将矛头指向了模型本身。由于默认配置为 opus4.8 的 high 思考模式，且用户此前从未调整过相关参数，因此认为该配置足以应对当前任务。但事实是，在超长上下文压力下，模型的幻觉问题急剧恶化，导致回复内容完全偏离主题，使得该上下文长度在实际应用中变得不可用。

用户进一步对比了 Claude Code 的表现。尽管 Claude Code 同样支持高达 1M 的上下文窗口，但它内置了智能压缩机制：当上下文达到 365K 时，系统会自动触发压缩，从而维持模型的响应质量和逻辑连贯性。相比之下，用户当前使用的 opus4.8 环境似乎缺乏类似的自动压缩或上下文优化机制，导致在长对话中直接暴露出模型的局限性。

此外，用户强调其使用的是官方 Max 订阅，且未通过任何第三方中转站，确保了请求路径的纯净性。虽然交互界面位于飞书聊天机器人，但底层工作逻辑仍依托于 Claude Code 的核心能力。这一案例也关联到用户此前在 LINUX DO 社区发布的帖子《L站特别适配版-个人参谋佬们需不需要这个？究竟要不要开源？》，探讨了此类定制化 AI 助手在工作流中的实际应用价值。

关键要点

长上下文幻觉风险：在使用 opus4.8 的 high 思考模式时，随着上下文长度增加，模型会出现严重的幻觉，表现为自问自答或生成无关内容，导致工作流中断。
自动压缩机制的重要性：Claude Code 在 1M 上下文窗口下，会在达到 365K 时自动触发压缩，有效维持了模型的稳定性和准确性；而缺乏此类机制的环境在长对话中表现不佳。
配置默认值的局限性：即使使用默认的 high 思考模式，也不足以保证在超长上下文场景下的可靠性，开发者需警惕默认配置在极端情况下的潜在缺陷。
官方订阅与路径纯净性：用户确认使用的是官方 Max 订阅，且未使用中转站，排除了网络延迟或中间件干扰导致幻觉的可能性，将问题锁定在模型本身的上下文处理能力上。
实际可用性存疑：在当前配置下，超长上下文长度对于该工作流而言是不可用的，提示开发者在构建长对话 AI 应用时需考虑上下文管理策略。

意义与影响

这一案例揭示了当前大语言模型在长上下文处理上的一个关键痛点：单纯增加上下文窗口大小并不等同于提升长对话的可用性。尽管 opus4.8 等模型在短上下文或标准任务中表现优异，但在缺乏智能压缩或上下文优化机制的情况下，其性能会随着上下文长度的增加而显著下降，甚至出现严重的逻辑错误。

对于开发者而言，这意味着在构建基于长上下文的 AI 工作流（如代码重构、长篇文档分析）时，不能仅依赖模型的默认配置。必须引入类似 Claude Code 的自动压缩、摘要或上下文管理策略，以确保模型在长对话中的稳定性和准确性。

此外，这也引发了对开源 AI 助手工作流设计的思考。用户提到的“个人参谋”项目及其开源讨论，反映了社区对于定制化、可控性强的 AI 辅助工具的强烈需求。如何在保持模型强大能力的同时，解决长上下文带来的幻觉和效率问题，将是未来 AI 应用开发的重要方向。

查看原文 →linux.do

Claude Opus 4.8超长上下文出现严重幻觉

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐