别再问AI模型身份了,纯属浪费Token
速览
文章批评了通过询问模型「你是谁」来确认身份的做法,认为这既浪费Token又毫无意义。由于模型训练阶段并不包含最终代号,且System Prompt可被随意修改,模型的回答仅受提示词约束,无法反映真实身份。例如,通过修改提示词,可以让任何模型伪装成其他模型名称。
AI 深度解读
背景
在当前的 AI 交互生态中,存在一种普遍但低效的用户习惯:许多用户倾向于通过向大语言模型(LLM)提问“你是什么模型?”来确认对话对象的身份。这种做法在技术社区(如 LINUX DO 的 AI 板块)中被资深用户指出是极不靠谱且完全无用的行为,本质上是对 Token 资源的纯粹浪费。这一现象反映了用户对模型底层机制与前端交互逻辑之间差异的认知偏差。
核心内容
该观点的核心逻辑建立在大模型训练机制与提示词工程(Prompt Engineering)的基础原理之上,主要包含以下两个层面的技术事实:
-
模型代号并非训练数据的一部分 大模型的代号(如 GPT-4、Llama 3 等)通常是在模型发布(Release)阶段才确定的商业或技术标识。在模型漫长的训练阶段,这些具体的代号并不存在,因此不会作为训练数据输入给模型。这意味着,模型在训练过程中从未“学习”过自己的名字或身份标识,它在本质上并不知道自己叫什么。
-
身份认知完全依赖于 System Prompt 既然模型不知道自己是谁,那么它在对话中回答“我是某某模型”完全是因为开发者在 System Prompt(系统提示词)中明确指定了这一身份。System Prompt 是发送给模型的一段前置指令,用于设定模型的角色、行为准则和身份。由于 System Prompt 的内容是完全可控且可随意修改的,模型的回答仅是对这段指令的复述或遵循,而非基于内部知识的自我认知。
文中举了两个具体案例来佐证这一逻辑:
- 反代场景的误导:作者提到自己通过 Codex 反代(Reverse Proxy)使用了名为 "gpt-5.5" 的服务,但如果他在 System Prompt 中设定模型回答自己是 "fable 5",模型就会毫不犹豫地回答自己是 "fable 5"。这证明了模型的身份标签是可以被任意篡改的。
- Codex 平台的默认行为:在 Codex 平台中,用户询问模型身份时,模型回复 "GPT-5"。这并非因为模型真的知道自己是 GPT-5,而是因为 Codex 的 System Prompt 中预设了该身份标识。用户只需查看 Codex 的 System Prompt 配置,就能理解为何会得到这样的回复。
关键要点
- 训练阶段无代号:模型代号是发布时的产物,训练数据中不包含模型自身的名称,因此模型不具备内在的身份记忆。
- 身份即提示词:模型回答“我是谁”完全取决于 System Prompt 中的设定,这是一种外部约束而非内部知识。
- 身份可被伪造:通过修改 System Prompt,可以让任何模型声称自己是任何名称(如将 GPT-5.5 伪装成 Fable 5),因此模型自报家门不具备真实性验证功能。
- Token 浪费:询问模型身份无法获取真实的技术信息,只会消耗请求的 Token 额度,属于无效交互。
意义与影响
这一解读揭示了当前大语言模型交互中的一个重要误区:将“角色扮演”误认为“事实陈述”。
对于普通用户而言,这意味着通过对话内容无法可靠地鉴别模型的真实版本或来源。任何声称自己是特定模型的回答,都可能是开发者通过 System Prompt 精心设计的“人设”。对于开发者和技术人员来说,这强调了在调试和评估模型时,应直接检查配置元数据或 API 返回的模型 ID,而不是依赖模型的自我陈述。此外,这也提醒用户在使用反代服务或第三方封装平台时,需警惕身份伪装带来的信任风险,因为模型的回答仅反映其被赋予的指令,而非其底层架构的真实属性。
