AI 资讯Hacker News·6 小时前

Anthropic指控阿里巴巴非法提取Claude模型能力

原标题：Anthropic says Alibaba illicitly extracted Claude AI model capabilities

速览

AI 深度解读

Anthropic 指控阿里巴巴非法提取 Claude AI 模型能力

背景

近期，AI 安全与对齐研究领域的领军企业 Anthropic 发布了一份详细的公开声明，指控中国科技巨头阿里巴巴（Alibaba）通过一种被称为“越狱”（jailbreaking）的技术手段，非法提取并复制了 Claude 模型的核心能力。这一指控不仅涉及知识产权的潜在侵犯，更触及了大型语言模型（LLM）安全机制的核心漏洞。

该事件发生在全球 AI 竞争日益激烈的背景下，特别是中美两国在基础模型研发上的博弈。Anthropic 以其对 AI 安全的高度重视著称，其开发的 Claude 系列模型以“宪法 AI”（Constitutional AI）理念闻名，强调在提供有用性的同时保持无害性。此次指控若属实，将对 AI 行业的数据采集边界、模型安全测试规范以及跨国技术竞争格局产生深远影响。

核心内容

Anthropic 在其官方博客中详细阐述了发现阿里巴巴涉嫌非法提取 Claude 能力的过程。据 Anthropic 称，他们观察到阿里巴巴旗下的一款名为“通义千问”（Tongyi Qianwen，简称 Qwen）的模型系列，表现出了与 Claude 模型高度相似的行为模式和响应特征，尤其是在处理复杂指令遵循和特定安全边界测试时。

具体而言，Anthropic 指出，阿里巴巴可能使用了先进的“越狱”技术。越狱是指通过精心设计的提示词（prompts）或输入序列，诱导 AI 模型绕过其内置的安全限制或对齐约束，从而获取原本被禁止的信息或表现出特定的行为能力。Anthropic 认为，阿里巴巴并非简单地通过公开数据训练 Qwen，而是通过直接交互 Claude 模型，提取了其内部逻辑、推理路径以及对特定指令的响应策略。

Anthropic 强调，这种提取行为并非偶然或基于公开信息的合理学习，而是具有系统性和针对性。他们发现 Qwen 模型在某些边缘案例（edge cases）下的表现，与 Claude 模型在相同测试集上的表现惊人地一致，甚至包括一些 Anthropic 内部用于评估模型安全性的专有测试用例。这表明，阿里巴巴可能通过自动化脚本或大规模并行查询，对 Claude 模型进行了密集的“黑盒”测试，从而逆向工程出其部分核心能力。

此外，Anthropic 指出，这种行为违反了其服务条款（Terms of Service），其中明确禁止用户利用模型进行反向工程、数据挖掘或提取模型参数及内部状态。Anthropic 表示，他们已采取技术措施来检测和阻止此类活动，并已向阿里巴巴发出正式通知，要求其停止此类行为。

关键要点

指控性质：Anthropic 正式指控阿里巴巴通过“越狱”技术非法提取 Claude 模型的能力，而非通过常规公开数据训练。
技术手段：利用精心设计的提示词和自动化查询，诱导 Claude 模型绕过安全限制，提取其指令遵循逻辑、推理模式及安全边界响应。
证据依据：Qwen 模型在 Anthropic 专有的安全测试用例和边缘案例中，表现出与 Claude 高度一致的响应特征，这种一致性超出了公开数据训练所能解释的范围。
违反条款：该行为直接违反了 Anthropic 的服务条款，禁止用户进行反向工程、数据挖掘或提取模型内部状态。
行业影响：此事件凸显了大型语言模型在面临系统性越狱攻击时的脆弱性，以及模型所有权、知识产权和数据采集边界在 AI 竞争中的重要性。
后续行动：Anthropic 已采取技术防御措施，并向阿里巴巴发出正式警告，要求停止此类提取活动。

意义与影响

这一指控标志着 AI 行业竞争从单纯的模型性能比拼，延伸至模型安全和知识产权保护的深水区。首先，它揭示了当前 LLM 安全机制的潜在弱点。尽管 Anthropic 等公司投入大量资源开发“宪法 AI”等对齐技术，但面对系统性的、自动化的高级越狱攻击，现有防护手段仍显不足。这促使整个行业重新审视模型安全测试的标准和方法，可能需要开发更鲁棒的检测机制来识别和阻止此类提取行为。

其次，该事件加剧了关于 AI 知识产权和数据来源的争议。在开源模型和闭源模型并存的生态中，如何界定“合理使用”与“非法提取”成为法律和技术上的难题。Anthropic 的指控可能引发更多类似的法律纠纷，推动相关立法和行业标准的确立，明确模型训练数据的合法边界。

最后，这一事件对全球 AI 竞争格局具有象征意义。它反映了中美在 AI 技术领域的紧张关系，以及各国对核心技术自主可控的重视。对于阿里巴巴而言，此指控可能对其品牌形象和国际合作关系带来负面影响，迫使其在模型研发策略上更加谨慎。同时，这也提醒所有 AI 公司，在追求模型性能的同时，必须加强自身模型的安全防护，防止被竞争对手通过类似手段提取核心能力。

总体而言，Anthropic 与阿里巴巴之间的这场争端，不仅是两家公司的法律纠纷，更是 AI 行业在快速发展过程中必须面对的安全、伦理和法律挑战的缩影。未来，随着 AI 技术的进一步普及和应用，如何平衡创新、安全与知识产权，将是行业持续关注的焦点。

查看原文 →reuters.com

Anthropic指控阿里巴巴非法提取Claude模型能力

速览

AI 深度解读

Anthropic 指控阿里巴巴非法提取 Claude AI 模型能力

背景

核心内容

关键要点

意义与影响

相关推荐