Anthropic:阿里关联人员用2.5万账号挖掘Claude以训练Qwen
速览
Anthropic发布报告,指控与阿里巴巴有关联的操作者使用约2.5万个账户大规模挖掘其Claude模型数据。此举旨在获取训练数据以优化或训练阿里巴巴的Qwen大语言模型。该事件揭示了大型科技公司间在模型训练数据获取上的潜在争议与竞争态势。
AI 深度解读
Anthropic指控:阿里关联方利用2.5万个账号“挖掘”Claude以训练Qwen
来源:Hacker News / 综合 Bloomberg 与 Reuters 报道 作者:Ryan Merket
背景
Anthropic 正在将关于模型蒸馏(Model Distillation)的争议,从单纯的服务条款纠纷上升为关于谁能访问美国前沿人工智能(Frontier AI)、云账号如何验证,以及中国廉价模型是依靠原创能力还是“收割”输出结果来竞争的政策辩论。
2026年6月10日,据 Bloomberg 和 Reuters 分别报道,Anthropic 向参议院银行委员会主席 Tim Scott 和资深议员 Elizabeth Warren 发送了一封信件。这封信件并非偶然,Anthropic 一直试图将模型蒸馏问题塑造为出口管制问题:如果受限制实体通过代理账号接触到前沿模型,其实际效果等同于间接获得了底层能力。
Anthropic 联合创始人兼 CEO Dario Amodei 及其妹妹 Daniela Amodei 于2021年离开 OpenAI 创立了该公司。多年来,Anthropic 始终将其商业模型业务定位为兼具软件业务属性的国家安全项目。此次指控进一步印证了这一叙事:前沿 AI 竞赛不再仅仅是关于谁能购买芯片或雇佣研究人员,更在于谁能阻止竞争对手利用高端模型的输出来训练自己的模型。
核心内容
Anthropic 指控与阿里巴巴相关的操作者在2026年4月22日至6月5日期间,使用了近2.5万个欺诈性账号,从 Claude 中提取了超过2880万次的交互数据,旨在加速阿里巴巴基础模型系列 Qwen 的开发。
指控的具体细节
- 规模与时间:该活动持续约六周,产生了2880万次 Claude 交互,涉及近25,000个账号。这是 Anthropic 迄今为止所知的最大规模的蒸馏攻击。
- 目标能力:攻击重点针对 Claude 的核心商业能力,特别是软件工程(Software Engineering)和代理推理(Agentic Reasoning)。
- 方法论:外部操作者利用欺诈性账号和类似代理的访问模式,生成大量 Claude 响应,这些响应被用于训练或改进其他模型。
历史背景与对比
Anthropic 并非首次提出此类指控。在2月份的一篇博文中,Anthropic 曾指控 DeepSeek、Moonshot AI 和 MiniMax 运行了工业规模的蒸馏活动,通过24,000多个欺诈性账号产生了超过1600万次 Claude 交互,目标包括代理推理、工具使用、编码、计算机视觉和类思维链推理。
相比之下,此次针对阿里关联方的指控在体量上更大,且目标从较小的 AI 实验室转向了拥有云业务、模型家族且直接有动力降低与美国前沿实验室竞争成本的大型平台公司。
Qwen 的战略地位
阿里巴巴已将 Qwen 置于其 AI 战略的核心。阿里云模型工作室(Alibaba Cloud Model Studio)向开发者和企业提供 Qwen、Wan 等模型的访问权限。Qwen 不仅是产品线,也是阿里云分发楔子,旨在进入 OpenAI、Anthropic、Google、DeepSeek、MiniMax 和 Moonshot 都在争夺的工作流中。
如果竞争对手能够以低成本“收割”编码和代理推理领域的示例,就能显著减少开发具有竞争力模型所需的原始训练和强化学习工作量。
归因与证据的局限性
Anthropic 的指控并未直接证明 Qwen 的公开能力源自 Claude,而是指出与阿里巴巴及 Qwen AI 实验室相关的操作者执行了提取活动。这一区分至关重要:彭博社和路透社描述的是 Anthropic 的指控,而非经过裁定的发现;该信件本身也不是包含可复现证据的技术报告。
Anthropic 表示,他们通过 IP 关联、请求元数据、基础设施指标、账号行为以及与合作伙伴的相互印证来识别蒸馏活动。这些方法足以用于封禁账号和政府简报,但尚不足以构成将模型权重或基准测试增益与 Claude 衍生数据直接关联的公开法医记录。
关键要点
- 指控升级:Anthropic 将模型蒸馏从服务条款违规问题提升为国家安全与出口管制问题,并直接向美国参议院银行委员会举报。
- 攻击规模空前:指控称阿里关联方在六周内利用2.5万个账号进行了2880万次交互,远超此前指控 DeepSeek 等公司的1600万次。
- 针对性强:攻击重点在于软件工程与代理推理,这是将通用聊天机器人转化为能编写软件、调用工具、执行多步骤任务的企业级系统的关键能力。
- 战略意图:Anthropic 试图证明,通过代理账号获取前沿模型输出,等同于绕过出口管制间接获取底层能力。
- 证据性质:目前证据基于行为模式、IP 关联和元数据分析,属于指控而非经过司法裁定的技术实证。
- 市场影响:如果指控属实,表明中国 AI 实验室可能通过低成本“收割”美国前沿模型能力,快速缩小性能差距,从而改变竞争经济学。
意义与影响
1. 前沿 AI 竞赛的新维度
这场争端标志着 AI 竞赛焦点的转移。过去,竞争主要集中在算力获取和人才招募;现在,竞争延伸至“数据主权”和“访问控制”。Anthropic 认为,防止竞争对手利用其高价值模型输出作为训练数据,已成为与芯片供应同等重要的战略环节。
2. 政策与监管的介入
Anthropic 通过向美国参议院议员提交信件,成功将技术争议政治化。其核心论点是:大规模蒸馏攻击需要计算资源、编排和基础设施,因此应被视为出口管制的一部分。如果监管机构采纳这一观点,未来对 AI 模型的访问控制、云账号验证以及模型输出的监管可能会更加严格,类似于对半导体出口的限制。
3. 商业模式的防御性重构
Anthropic 的指控揭示了前沿模型厂商的新策略:访问控制不仅是产品策略,也是知识产权防御策略。每一笔 API 调用既是客户互动,也可能成为竞争对手低成本获取训练数据的途径。Anthropic 试图通过政策手段和技术手段双重封锁这种“套利”行为,以保护其高昂模型研发的投资回报。
4. 对中国 AI 发展的潜在制约
尽管 Anthropic 的指控缺乏公开的法医级证据,但其策略旨在增加中国 AI 实验室获取高质量训练数据的成本和难度。如果阿里云或 Qwen 团队被证实通过欺诈手段获取数据,可能会面临更严厉的国际制裁、云服务商的封锁或声誉损失。反之,如果 Qwen 确实通过此类手段快速提升了能力,则反映了中国 AI 产业在资源受限环境下的高效竞争策略。
5. 开发者与市场的两难
对于开发者和企业而言,廉价且强大的模型(如 Qwen)具有巨大吸引力。然而,这些模型的低成本可能建立在“收割”其他公司昂贵研发成果的基础上。Anthropic 的指控迫使市场审视这种经济学的道德和法律边界:开发者是应该支持通过蒸馏降低门槛的模型,还是支持强调原创能力和严格访问控制的模型?
Anthropic 对阿里巴巴的指控是前沿模型厂商将访问控制视为产品、政策和知识产权三重防御的明确信号。这一事件定义了 AI 平台竞争的新阶段:模型本身已成为训练数据生成器,而谁能控制这一生成过程,谁就能在下一轮竞争中占据优势。
