好莱坞未来不在通用AI:定制模型才是影视制作出路
速览
尽管生成式AI被寄予厚望,但目前多数视频模型仅能生成视觉不一致的短片,难以支撑付费观影体验。好莱坞巨头与硅谷的AI合作频频破裂,促使制片方转向定制化模型训练。例如《Dear Upstairs Neighbors》便使用了基于Google Veo和Imagen定制的模型进行概念艺术创作。
AI 深度解读
好莱坞的未来:并非向通用生成式 AI 模型输入提示词
背景
尽管生成式 AI(Generative AI)被广泛预言将彻底颠覆电影制作行业,但截至目前,市场上尚未出现真正让观众愿意付费观看的 AI 主导作品。大多数 AI 视频模型目前仍只能生成短促且视觉不一致的片段,而好莱坞一些大型 AI 合作项目的突然破裂,更让业界质疑硅谷新技术的可靠性。目前,大型制片厂利用生成式 AI 主要产出的仅是低质量的短视频内容(即文中所述的 "video slop")。
然而,今年翠贝卡电影节(Tribeca Film Festival)上展映的实验性项目表明,情况可能正在发生变化。这些项目展示了人类艺术家如何以引人入胜的方式利用该技术,而非简单地将提示词输入到通用的生成式 AI 模型中。
核心内容
今年的翠贝卡电影节并非只有低质量的 AI 内容。虽然生成式 AI 很难独立创作出一部引人入胜的电影,但电影节上的多部影片展示了人类艺术家如何利用该技术实现独特的艺术表达。
1. 粗糙的尝试:技术局限性的体现 部分 AI 电影虽然不像 OpenAI 或 xAI 在网络上散布的那些视频垃圾那样糟糕,但仍暴露了生成式内容相比人类创作艺术显得缺乏生机的原因:
- 《Roar》:由 Illuminai Studios 制作的动画短片,感觉更像是一系列 AI 生成片段的混乱蒙太奇,而非连贯的电影作品。
- 《ChikaBOOM!》:由 Asteria Film Co. 制作,讲述一名训练中的魔术师的故事。该片缺乏快节奏奇幻题材所需的视觉和声音打磨,难以吸引观众。 这两部作品的粗糙感反映了其 AI 优先制作流程中固有的技术局限性。
2. 成功的案例:定制化工作流与人类主导 相比之下,Google DeepMind 的《Dear Upstairs Neighbors》和 OpenAI 的《Mauvais Soleil》展示了当生成式 AI 以更具巧思的方式部署时,如何克服这些挑战。
-
《Dear Upstairs Neighbors》:Google DeepMind 的定制方案 这部由皮克斯资深人士 Connie Qin He 编剧并导演,并与 Google DeepMind 研究人员合作的作品,讲述了一位疲惫的年轻女性试图入睡,却因楼上邻居的噪音而不断惊醒的故事。
- 视觉风格定制:为了赋予影片独特的风格,He 邀请了皮克斯制作设计师 Yingzong Xin 使用 Photoshop 和丙烯颜料绘制概念艺术。这种表现主义美学是故事呈现的关键,但也给视频生成带来了挑战。
- 技术突破:大多数 AI 视频模型难以将绘画风格转化为视觉一致的片段。DeepMind 工程师为此开发了 Veo 和 Imagen 的定制版本,专门允许艺术家微调输出结果。
- 混合工作流:由于定制模型是在 Xin 的概念艺术上训练的,它们能一致地生成符合 He 愿景的镜头。然而,为了构建连贯的故事场景,创作团队采用了传统方法:首先使用行业标准软件 Autodesk Maya 制作粗糙的动画(用于确保场景按预期展开),然后将这些粗糙动画输入 Veo 进行视觉润色,最后再使用 Veo 和 Imagen 生成额外的风格化资产进行增强。
- 结论:该片证明了生成式 AI 可以作为辅助艺术家开发想法的定制工具。如果仅使用 Google 的通用模型,该片在视觉上不会如此出色。该项目在很大程度上也是 Google 技术的商业展示。
-
《Mauvais Soleil》与《Smoked》:OpenAI 的局限与适应 OpenAI 在电影节上的存在颇具讽刺意味,因为其刚刚完全关闭了 Sora 视频生成服务,导致其长片《Critterz》未能亮相戛纳电影节。
- 《Smoked》:Alice Gu 的半自传体剧情片使用 Sora 重现了帕利塞德大火(Palisades Fire)。广角镜头下的火焰场景略显卡通化,但在近距离镜头(使用类似 Volume 的设备拍摄)中效果稍好。
- 《Mauvais Soleil》:Youssef Michraf 的作品包含大量由 OpenAI 创意工具生成的逼真场景。由于大部分镜头仅持续几秒,且唯一说话的角色是看不见的旁白,这些技术细节反而被视为有意为之的艺术选择。影片讲述了一个人的生活被人工智能扭曲的故事,这种叙事框架巧妙地掩盖了技术的局限性。
3. 独立制作的潜力与边界 作家兼导演 Ash Koosha 仅花费 2,000 美元的计算成本,利用 Kling AI、Claude、Gemini 和 Nano Banana 等工具,独自制作了纪录片剧情片《Dreams of Violets》。该片聚焦于伊朗过去一年发生的全国性抗议活动,讲述了一群被困在巷子里的人的故事。虽然 Koosha 在几周内就完成了制作,且叙事有力,但在视觉上并未取得突破性进展。
关键要点
- 通用模型并非终极解决方案:将提示词直接输入“ Vanilla ”(未经定制/通用)的生成式 AI 模型,无法产生好莱坞主流制片厂愿意署名的高质量商业项目。
- 人类艺术家是核心驱动力:成功的 AI 电影制作流程必须由具有清晰创意愿景的人类艺术家主导。AI 应被视为辅助工具,而非替代者。
- 定制化工作流是关键:大型 AI 公司(如 Google)与制片厂合作,构建针对特定工作流程的定制模型(如 DeepMind 为《Dear Upstairs Neighbors》定制的 Veo/Imagen),是更可行的未来方向。
- 混合技术流程优于纯 AI 生成:结合传统动画软件(如 Maya)进行基础构图和动作设计,再结合 AI 进行视觉润色和风格化,能更好地保证故事的连贯性和视觉一致性。
- 叙事框架可弥补技术缺陷:在 OpenAI 的作品中,通过限制镜头时长、使用旁白或特定的视觉风格(如卡通化火焰),创作者可以将 AI 生成的瑕疵转化为有意为之的艺术风格。
- 低成本独立制作的可行性:生成式 AI 确实降低了独立制作的门槛,使得小团队或个人能在极低成本下完成叙事完整的作品,但在视觉创新上仍有局限。
意义与影响
这篇文章揭示了好莱坞乃至整个影视行业对生成式 AI 认知的转变:从最初的“提示词即电影”的盲目乐观,转向务实的“人机协作”模式。
- 行业标准的重塑:未来的电影制作标准将不再仅仅是“是否使用了 AI”,而是“如何使用 AI”。定制化的模型训练和混合工作流将成为高端制作的新常态。
- 大型科技公司的角色定位:Google、OpenAI 等巨头不再仅仅是提供通用工具,而是需要深入理解影视制作的具体痛点,提供嵌入工作流的定制解决方案。这也解释了为何 Google 愿意投入资源为特定项目训练定制模型。
- 创意主导权的回归:文章强调,无论技术如何进步,人类艺术家的创意决策、概念设计和叙事把控能力依然是不可替代的核心。AI 的价值在于执行力和风格化增强,而非创意源头。
- 对“AI 垃圾”内容的警示:虽然低质量的 AI 短视频内容(video slop)不会消失,但它无法代表行业未来。好莱坞的重量级制片厂将避免将品牌与纯 AI 生成的低质内容挂钩,转而追求高完成度、高艺术价值的混合制作项目。
总之,好莱坞的未来不在于用 AI 取代人类,而在于通过高度定制化的技术工具,放大人类艺术家的创意潜能。
