独立音乐人起诉Google,指控其利用YouTube上传歌曲训练Lyria AI
速览
一群独立音乐人提起诉讼,指控Google非法使用他们在YouTube上上传的歌曲来训练其Lyria 3音乐AI模型。Google已提交驳回诉讼动议,辩称原告缺乏具体证据,且用户协议授予了广泛的使用许可。该案件揭示了AI训练数据版权问题的法律争议。
AI 深度解读
背景
近期,一群独立音乐人起诉 Google,指控其非法使用上传至 YouTube 的歌曲来训练其音乐 AI 模型 Lyria 3。面对诉讼,Google 提交了一份驳回案件的动议(motion to dismiss),试图从法律层面切断指控。与此同时,Google 在公开场合对于是否使用 YouTube 内容训练其音乐 AI 保持沉默,这种“既不承认也不否认”的态度引发了外界对其实际行为的广泛猜测。
核心内容
Google 几乎可以肯定正在将 YouTube 创作者的视频内容作为“猎物”,用于训练其音乐 AI Lyria,但它目前拒绝公开承认这一点。
这场法律纠纷的核心在于 Google 的辩护策略。在驳回动议中,Google 辩称原告缺乏证据支持其假设,即 Google 确实使用了他们特定的作品进行训练。更重要的是,Google 指出,根据 YouTube 的服务条款(Terms of Service),用户在上传内容时,已授予 YouTube 及其母公司 Google 广泛的使用许可。该条款授权 Google “复制、分发 [以及] 创作衍生作品”,这涵盖了诉讼中指控的行为。因此,Google 认为即便指控属实,其行为也是合法的。
当被直接问及 Google 是否使用 YouTube 视频来训练 Lyria 3 音乐模型时,公司拒绝置评。然而,结合过往的公开声明,答案似乎显而易见。
2024 年 4 月,YouTube CEO Neal Mohan 在接受 Bloomberg 采访时透露,“部分”YouTube 视频可能被用于内部训练像 Gemini 这样的模型。同年晚些时候,一篇关于创作者工具的官方博客文章进一步证实了这一点,称:“我们使用上传到 YouTube 的内容来改善 YouTube 和 Google 上创作者和观众的体验,包括通过机器学习和 AI 应用。”此外,Google 还向 CNBC 确认,它正在使用 YouTube 上传内容来训练 Gemini 和视频生成模型 Veo。
唯一未被明确确认的是,Google 是否也将 YouTube 上传内容用于训练 Lyria。但在驳回动议中,Google 重申了服务条款赋予的权利,暗示其有权基于上传内容进行任何操作。
尽管事实似乎显而易见,但 Google 拒绝“自曝”有其战略考量。目前,公司没有理由公开承认这一点。在诉讼 pending(待决)期间,保持“合理的否认”(plausible deniability)是一种经过计算的举动,旨在避免在法庭上留下直接的书面证据,从而增加原告举证难度。
关键要点
- 诉讼指控:独立音乐人起诉 Google,声称其非法使用上传至 YouTube 的歌曲训练 Lyria 3 模型。
- Google 的辩护逻辑:
- 证据不足:原告无法证明 Google 确实使用了其特定作品。
- 合同授权:依据 YouTube 服务条款,用户已授予 Google 广泛的使用权,包括复制、分发和创作衍生作品的权利。
- 公开沉默与间接确认:
- Google 拒绝直接回答是否使用 YouTube 内容训练 Lyria。
- 但 CEO Neal Mohan 及官方博客已确认,YouTube 内容被用于训练 Gemini 和 Veo 等模型。
- 业界普遍推测,Lyria 的训练数据来源与 Gemini/Veo 类似。
- 法律策略:Google 选择保持“合理的否认”,在诉讼期间避免留下承认使用数据的书面记录,这是一种保护自身法律利益的计算性举措。
意义与影响
这一事件揭示了大型科技公司在 AI 训练数据获取上的典型矛盾:事实上的广泛使用与法律上的模糊处理。
- 服务条款的边界争议:Google 试图利用用户协议中的广泛许可条款作为“护身符”。这引发了关于“上传即授权”在 AI 时代是否依然合理、以及用户是否真正理解并同意其内容被用于训练商业 AI 模型的深层法律与伦理问题。
- AI 训练数据的透明度缺失:尽管 Google 承认使用 YouTube 数据训练 Gemini 和 Veo,但对 Lyria 的沉默表明,公司倾向于在涉及具体模型和数据集对应关系时保持模糊。这种不透明性使得创作者难以追踪自己的作品是否被用于训练特定的垂直领域 AI。
- 诉讼策略的风向标:Google 的“否认+合同抗辩”组合拳可能成为未来 AI 公司应对版权诉讼的标准模板。如果法院支持 Google 基于服务条款的抗辩,可能会为科技巨头利用平台用户生成内容(UGC)训练 AI 开辟更广阔的法律空间,但也可能激起创作者社区更强烈的反弹。
- 创作者权益的觉醒:独立音乐人的集体诉讼标志着内容创作者开始从被动接受平台规则,转向主动通过法律手段挑战 AI 数据抓取行为。这预示着未来围绕 AI 训练数据版权的纠纷将更加频繁和复杂。
