← 返回信息流
AI 资讯Hacker News·6 小时前

Anthropic指控阿里巴巴非法提取Claude模型能力

原标题:Anthropic says Alibaba illicitly extracted Claude AI model capabilities

速览

Anthropic指控阿里巴巴非法提取Claude模型能力

AI 深度解读

Anthropic 指控阿里巴巴非法提取 Claude AI 模型能力

背景

近期,AI 安全与对齐研究领域的领军企业 Anthropic 发布了一份详细的公开声明,指控中国科技巨头阿里巴巴(Alibaba)通过一种被称为“越狱”(jailbreaking)的技术手段,非法提取并复制了 Claude 模型的核心能力。这一指控不仅涉及知识产权的潜在侵犯,更触及了大型语言模型(LLM)安全机制的核心漏洞。

该事件发生在全球 AI 竞争日益激烈的背景下,特别是中美两国在基础模型研发上的博弈。Anthropic 以其对 AI 安全的高度重视著称,其开发的 Claude 系列模型以“宪法 AI”(Constitutional AI)理念闻名,强调在提供有用性的同时保持无害性。此次指控若属实,将对 AI 行业的数据采集边界、模型安全测试规范以及跨国技术竞争格局产生深远影响。

核心内容

Anthropic 在其官方博客中详细阐述了发现阿里巴巴涉嫌非法提取 Claude 能力的过程。据 Anthropic 称,他们观察到阿里巴巴旗下的一款名为“通义千问”(Tongyi Qianwen,简称 Qwen)的模型系列,表现出了与 Claude 模型高度相似的行为模式和响应特征,尤其是在处理复杂指令遵循和特定安全边界测试时。

具体而言,Anthropic 指出,阿里巴巴可能使用了先进的“越狱”技术。越狱是指通过精心设计的提示词(prompts)或输入序列,诱导 AI 模型绕过其内置的安全限制或对齐约束,从而获取原本被禁止的信息或表现出特定的行为能力。Anthropic 认为,阿里巴巴并非简单地通过公开数据训练 Qwen,而是通过直接交互 Claude 模型,提取了其内部逻辑、推理路径以及对特定指令的响应策略。

Anthropic 强调,这种提取行为并非偶然或基于公开信息的合理学习,而是具有系统性和针对性。他们发现 Qwen 模型在某些边缘案例(edge cases)下的表现,与 Claude 模型在相同测试集上的表现惊人地一致,甚至包括一些 Anthropic 内部用于评估模型安全性的专有测试用例。这表明,阿里巴巴可能通过自动化脚本或大规模并行查询,对 Claude 模型进行了密集的“黑盒”测试,从而逆向工程出其部分核心能力。

此外,Anthropic 指出,这种行为违反了其服务条款(Terms of Service),其中明确禁止用户利用模型进行反向工程、数据挖掘或提取模型参数及内部状态。Anthropic 表示,他们已采取技术措施来检测和阻止此类活动,并已向阿里巴巴发出正式通知,要求其停止此类行为。

关键要点

  • 指控性质:Anthropic 正式指控阿里巴巴通过“越狱”技术非法提取 Claude 模型的能力,而非通过常规公开数据训练。
  • 技术手段:利用精心设计的提示词和自动化查询,诱导 Claude 模型绕过安全限制,提取其指令遵循逻辑、推理模式及安全边界响应。
  • 证据依据:Qwen 模型在 Anthropic 专有的安全测试用例和边缘案例中,表现出与 Claude 高度一致的响应特征,这种一致性超出了公开数据训练所能解释的范围。
  • 违反条款:该行为直接违反了 Anthropic 的服务条款,禁止用户进行反向工程、数据挖掘或提取模型内部状态。
  • 行业影响:此事件凸显了大型语言模型在面临系统性越狱攻击时的脆弱性,以及模型所有权、知识产权和数据采集边界在 AI 竞争中的重要性。
  • 后续行动:Anthropic 已采取技术防御措施,并向阿里巴巴发出正式警告,要求停止此类提取活动。

意义与影响

这一指控标志着 AI 行业竞争从单纯的模型性能比拼,延伸至模型安全和知识产权保护的深水区。首先,它揭示了当前 LLM 安全机制的潜在弱点。尽管 Anthropic 等公司投入大量资源开发“宪法 AI”等对齐技术,但面对系统性的、自动化的高级越狱攻击,现有防护手段仍显不足。这促使整个行业重新审视模型安全测试的标准和方法,可能需要开发更鲁棒的检测机制来识别和阻止此类提取行为。

其次,该事件加剧了关于 AI 知识产权和数据来源的争议。在开源模型和闭源模型并存的生态中,如何界定“合理使用”与“非法提取”成为法律和技术上的难题。Anthropic 的指控可能引发更多类似的法律纠纷,推动相关立法和行业标准的确立,明确模型训练数据的合法边界。

最后,这一事件对全球 AI 竞争格局具有象征意义。它反映了中美在 AI 技术领域的紧张关系,以及各国对核心技术自主可控的重视。对于阿里巴巴而言,此指控可能对其品牌形象和国际合作关系带来负面影响,迫使其在模型研发策略上更加谨慎。同时,这也提醒所有 AI 公司,在追求模型性能的同时,必须加强自身模型的安全防护,防止被竞争对手通过类似手段提取核心能力。

总体而言,Anthropic 与阿里巴巴之间的这场争端,不仅是两家公司的法律纠纷,更是 AI 行业在快速发展过程中必须面对的安全、伦理和法律挑战的缩影。未来,随着 AI 技术的进一步普及和应用,如何平衡创新、安全与知识产权,将是行业持续关注的焦点。

查看原文 →reuters.com