Agent SkillLINUX DO · AI·2 小时前

除糖果色盲测试外新招验AI中转是否掺水

原标题：除了糖果测试和色盲题,再分享几招验中转是满血还是掺水的办法(都能自己跑)

速览

针对当前AI中转服务掺杂次等模型的问题，作者分享了四种验证方法：利用Anthropic官方响应密码签名验真、自出唯一答案题目与官方直采对比对账、按照官方计费口径逐笔核对费用、以及保留一路直采接口作为对照组。这些方法旨在帮助用户分辨中转站是否在模型型号、token计费等方面掺水，强调需持续更新题目以防被刷。

AI 深度解读

背景

近期，AI 中转服务市场异常活跃，尤其是 Fable 等新模型上线后，大量用户通过中转站访问闭源模型（如 Claude、GPT 等）。然而，供应商“掺水”现象频发：部分中转站用低配模型冒充高配模型（如用 Sonnet 冒充 Opus、用 Haiku 冒充 Opus）、虚报 token 用量、擅自缩短上下文窗口，甚至直接用 GPT 套壳伪装成 Claude。用户最常用的验证手段——糖果测试（如“Strawberry 里有多少个 r”）和红绿色盲题（如“用色盲能识别的颜色画一个图案”）——因题库公开，已被部分中转站针对性“背题”，导致测试失效。原作者本身运营一个小型中转站，强调不推广、不挂优惠，纯粹分享自己日常用来验证真实性的几项方法，并希望社区贡献更狠的“探针题”。

核心内容

作者给出了四类方法（外加一条无效方法），用于判断中转站到底是在直连官方模型，还是掺了水。

1. 验签名（Signature Verification）

Anthropic 官方后端返回的响应中带有密码学签名。逆向工程制作的 GPT 套壳冒充 Claude 时，无法伪造这个签名。只要检查响应签名是否有效，就能确定上游是否为真正的 Anthropic 官方。但注意：签名只能证明“来源是 Anthropic”，不能证明“模型型号”。例如，挂着 Opus 卖 Haiku，签名依然有效。因此这个方法必须与下文配合使用。

2. 自出题并拿官方对答案

思路与糖果测试相同，但题目要自己设计、定期更换，使站长无法预先背诵。要求题目答案唯一、且模型本身难以背出（非训练数据中常见的问题）。具体做法：先用官方 sk-ant 直连跑一遍题目，再用中转跑一遍，逐字符对比输出。作者最近在使用的一个题：

题目：100! 在12进制下末尾有几个0？
唯一解：48
官方直采 Fable-5 输出：48，与官方逐字一致
Sonnet-4-6 输出：48，并给出了 p-adic 推导（ν₃=48、ν₂=97，取最小值48）
掺水模型：当场算错，输出错误数字。

3. 充真钱对账

这是最枯燥但最实在的方法。按照官方计费口径逐笔核对：

放大 completion 倍率（例如实际输出100 token，却按150 token 收费）
虚报 token（多报输入/输出 token 数）
偷偷砍上下文（比如官方支持200K，实际只给32K）
缓存价格悄悄翻倍、同样的额度突然腰斩

作者提到之前一篇《50天跑路实录》的中转站，翻车前兆就是从账上露馅的。

4. 留一路官方密钥直采兜底

保持一条直接通过官方 sk-ant 密钥获取的路线作为对照组。当号池抽风时自动切换过去，同时随时有官方的输出作为比对基线。

无效方法：问模型“你是谁”

很多用户习惯问“你是谁”来验证模型，但作者指出这个方法完全无效。理由：

官方直采的 Fable-5 被问到时会回答“我是 Sonnet 4.5”，甚至声称 Fable 不存在——因为训练数据截止时间早于发布，模型确实不知道自己的名字。
套壳站想让模型喊“I am Fable 5”只需一条系统提示词（有佬曾抓包 Antigravity 反代验证过）。
因此，自报家门什么都证明不了。

关键要点

密码学签名只保真不保型号：验签名可确认真实 Anthropic 来源，但不能排除“降级卖廉价模型”的欺诈。
自出题 + 官方对答案是最可靠方法：答案唯一、模型无法预知、定期更换，站长无法提前背题。
记账对账是硬功夫：追踪 completion 倍率、token 虚报、上下文缩减等小动作，能在资金层面提前发现风险。
保留官方直采作为对照组：即使号池不稳定，也能随时对比输出质量与计费逻辑。
“你是谁”类问题毫无验证价值：模型回答可被任意改写，连官方版本自己都不知道自己是谁。
核心原则：勤快——没有银弹，需要结合多种手段并持续更新题库与对账周期。

意义与影响

这篇文章源自一线运营者的实操经验，反映了 AI 中转服务行业中严重的信任与信息不对称问题。用户付费购买的是特定模型的推理能力，但中转站可以通过多种隐蔽手段降低成本、扩大利润，而普通用户几乎无法察觉。作者提供的四步法：

降低了验证门槛——不需要深度技术背景，通过密码学签名、自出题、对账和直采兜底，普通用户也能自行鉴别。
推动行业透明化——当越来越多用户采用这些方法，掺水中转站的生存空间会被压缩，倒逼服务商要么提供真实模型，要么公开说明降级策略。
社区共创探针题——作者期望有更狠的“探针题”，这种开放态度会促进社区共建题库，形成动态博弈，类似安全领域的“攻防对抗”。
警示风险——文章间接提醒用户：依赖中转服务时，不仅要看价格，更要关注长期可靠性。那些以“超低价”吸引用户的中转站，很可能会通过虚报 token、砍上下文等方式变相涨价，甚至卷款跑路（如“50天跑路实录”案例）。

总体而言，这篇文章为 AI 模型消费者提供了一套实用的独立验证工具箱，并呼吁社区共同维护信息真实性，对行业良性发展有积极意义。

查看原文 →linux.do

除糖果色盲测试外 新招验AI中转是否掺水

速览