← 返回信息流
AI 资讯TechCrunch AI·8 天前

ElevenLabs 新音乐生成模型支持曲目中途切换风格

原标题:ElevenLabs’ new music-generation model can switch genres mid-track

速览

ElevenLabs 推出了一款全新的音乐生成模型,允许用户在不影响整首歌曲其余部分的情况下,对特定段落进行重新生成。这一功能使得创作者能够灵活地在曲目中途切换音乐风格。该技术的突破为音乐制作提供了更高的可控性和创作自由度。

AI 深度解读

背景

语音人工智能公司 ElevenLabs 发布了其音乐生成模型的最新版本——Music v2。这一更新距离该公司推出首个音乐生成模型版本已近 10 个月。当前,AI 实验室正竞相发布能够生成专业级音乐的新模型,竞争格局日益激烈。Google、Stability AI 和 Suno 等竞争对手近期也推出了具备生成长度更长、结构更复杂曲目能力的新模型。例如,在 Google I/O 开发者大会上,Google 展示了其 Flow Music 工具,该工具支持轻松制作翻唱歌曲、按段落编辑歌曲以及生成音乐视频。

核心内容

ElevenLabs 表示,Music v2 旨在同时处理人声和作曲中的复杂性。该模型的核心突破在于其能够在曲目中途切换流派。具体而言,模型可以从歌剧无缝过渡到重金属音乐,再返回,或者在不丧失连贯性的情况下呈现快节奏的说唱。此外,它还能在曲目中添加非音乐音效。

在创作流程上,新模型赋予了艺术家更高的控制力。艺术家可以选择歌曲的特定部分,并通过提示词(prompts)重新生成该部分,而无需触碰曲目的其他部分。与以往仅生成短片段不同,艺术家现在可以分段构建歌曲,包括前奏、主歌和副歌,然后将这些部分拼接在一起。ElevenLabs 强调,新模型在跨语言、歌词、人声和编曲方面的表现更加可靠。

关键要点

  • 流派无缝切换:Music v2 支持在曲目进行中实时切换音乐风格,如从歌剧到重金属,或处理快节奏说唱而不失连贯性。
  • 局部重绘能力:艺术家可以指定歌曲的特定段落,仅通过提示词重新生成该部分,保留其余部分不变,实现了精细化的编辑控制。
  • 结构化创作:支持按段落(前奏、主歌、副歌等)分别生成并拼接,从而构建完整的长曲目,而非仅限于短片段。
  • 多模态增强:除了音乐本身,模型还能在曲目中集成非音乐音效,丰富了声音设计的维度。
  • 商业化合规性:ElevenLabs 强调该模型基于授权数据构建,且已获得商业使用许可。这一举措旨在规避版权风险,鉴于 Suno 和 Udio 等其他 AI 音乐初创公司此前曾面临版权诉讼。
  • 多语言与多语言稳定性:新模型在多种语言、歌词处理、人声生成及编曲方面的表现更加稳定可靠。

意义与影响

Music v2 的发布标志着 AI 音乐生成技术从“生成短片段”向“构建完整作品”迈出了关键一步。通过支持分段创作和局部编辑,ElevenLabs 解决了此前 AI 音乐工具在长格式内容生成中难以保持结构完整性和一致性的痛点。

在商业层面,ElevenLabs 强调其数据经过授权且可用于商业用途,这在当前 AI 音乐版权争议频发的背景下具有战略意义。通过与唱片公司达成交易并确立合规的数据来源,ElevenLabs 试图在 Suno 和 Udio 等竞争对手面临的法律困境中建立差异化优势,为专业营销和品牌团队提供安全的解决方案。

此外,该模型通过 ElevenCreative 工具面向营销和品牌团队开放,并推出了专门的 ElevenMusic 平台用于创建 AI 生成歌曲,同时即将开放 ElevenAPI。这表明 ElevenLabs 正积极将其技术从实验性应用推向主流商业工作流,旨在成为专业内容创作的基础设施。随着 Google、Suno 等巨头纷纷入局,AI 音乐生成的竞争焦点已从单纯的技术演示转向对长格式内容控制力、版权合规性及商业化落地能力的综合较量。

查看原文 →techcrunch.com