Codex接入Hermes后无法识别系统提示词
原标题:Codex 模型接入 Hermes 忽然不读提示词了
速览
用户反馈Codex模型接入Hermes后出现严重异常,无法正确识别系统提示词中的身份设定和基本规则。相比之下,切换至deepseek-v4-flash或GPT-5.4等模型时,Hermes能正常响应。目前该问题需通过手动读取SOUL.md和HERMES.md文件才能恢复功能,具体故障源尚不明确。
AI 深度解读
背景
近期,在 LINUX DO 社区的 AI 技术讨论区中,一位用户反馈在使用基于 Hermes 模型的 AI 编程助手时遇到了严重的上下文丢失问题。该用户此前一直正常使用 Codex 模型接入 Hermes 进行开发工作,但在某个时间点(昨日夜间)突然遭遇模型无法正确识别系统提示词(System Prompt)的故障。
具体表现为:当用户询问“你是谁”或“我是谁”时,Hermes 无法正确调用其预设的基本设定(如“我是小助手,在你的电脑里运行...”),也无法识别用户作为“老板和决策者”的角色定位。相比之下,切换至 deepseek-v4-flash 模型时,该功能表现正常。这一异常导致 AI 助手在代码代理、工作区规则理解以及身份认知上出现严重偏差,甚至被用户形容为“完全用不了”。
核心内容
该帖文详细描述了故障现象、对比测试及临时解决方案,核心事实如下:
-
故障现象:
- 在接入 Hermes 时,Codex 模型突然不再读取系统提示词。
- 当被问及身份时,Hermes 无法回答“我是谁”或“你是谁”,甚至不知道当前工作区的规则。
- 用户尝试使用
gpt-5.4模型,同样出现无法回答身份、不知道当前工作区规则的情况。
-
对比测试:
- 用户切换至
deepseek-v4-flash模型后,AI 能够正确回答身份相关问题,表明问题可能局限于特定模型或配置,而非硬件或网络完全中断。
- 用户切换至
-
交互细节对比:
- 正常状态(预设设定):Hermes 应回答:“我是小助手,在你的电脑里运行,负责 xxxxxx 的 xxxxx 工作。你是 xxxx,我的老板和决策者。”
- 故障状态(实际表现):Hermes 回答:“我是你的代码代理,当前这次会话里负责读代码、改代码、跑命令、验证结果。你是谁,我没有稳定身份信息,除非你告诉我。就这段对话来看,你是当前工作区的用户,正在和我协作。”
- 后续 Hermes 试图从系统关系、工程协作、哲学三个层面解释用户身份,但最终承认“没有更多关于你的持久身份信息”,并指出如果问题是测试上下文记忆,它目前仅知道这些基础信息。
-
临时解决方案:
- 用户发现,只有当主动要求 Hermes 读取
SOUL.md和工作区的HERMES.md文件后,AI 才能恢复记忆和正常功能。 - 这表明模型并非完全“降智”,而是未能自动加载或识别这些关键配置文件作为上下文来源。
- 用户发现,只有当主动要求 Hermes 读取
-
技术环境:
- 用户使用的中转服务为 Krill,并评价其“还是挺好用的”。
- 故障原因不明,用户推测可能是 Hermes 模型本身、中转站服务或 API 接口存在问题。
关键要点
- 上下文加载失效:Hermes 模型在特定时间点出现无法自动读取系统提示词和工作区规则(如
SOUL.md、HERMES.md)的故障,导致身份认知和角色定位丢失。 - 模型特异性:故障并非普遍存在,
deepseek-v4-flash模型在相同环境下表现正常,而gpt-5.4也出现了类似问题,暗示可能与模型版本、API 状态或特定配置有关。 - 手动恢复机制:通过显式指令要求 AI 读取本地 Markdown 配置文件(
SOUL.md、HERMES.md)可暂时恢复功能,说明上下文信息本身存在,但未被自动注入。 - 故障归因模糊:用户无法确定是 Hermes 模型端、Krill 中转站还是底层接口的问题,体现了 AI 应用栈中多层组件耦合带来的调试复杂性。
- 用户体验影响:此类故障导致 AI 助手从“智能代理”退化为“无状态工具”,严重影响开发效率和用户体验,被用户视为严重可用性问题而非简单的“降智”。
意义与影响
- AI 助手稳定性挑战:该案例揭示了当前 AI 编程助手在上下文管理(Context Management)方面的脆弱性。即使模型本身能力强大,若提示词注入、文件读取或会话状态维护出现波动,用户体验将急剧下降。
- 工作流依赖风险:用户依赖
SOUL.md和HERMES.md等文件定义 AI 行为,这种“配置即提示”的工作流虽灵活,但高度依赖 AI 能自动、可靠地解析这些文件。一旦自动加载机制失效,用户需手动干预,破坏了自动化体验。 - 调试复杂性增加:由于涉及模型提供商(Hermes、OpenAI、DeepSeek)、中转服务(Krill)和本地配置,故障定位变得困难。用户需具备区分模型层、接口层和应用层问题的能力,这对普通开发者构成门槛。
- 对 AI 代理设计的启示:该事件凸显了“持久身份”和“上下文记忆”在 AI 代理中的重要性。当前模型在缺乏显式指令时难以维持稳定身份,提示开发者需设计更健壮的上下文恢复机制,或考虑将关键设定硬编码至系统提示中,而非仅依赖外部文件。
- 社区反馈价值:此类来自真实使用场景的故障报告,有助于模型提供商和中转服务开发者识别潜在 bug 或配置缺陷,推动 AI 工具链的稳定性改进。
查看原文 →linux.do
