← 返回信息流
技术博客Google AI Blog·2 天前

Google I/O 2026 揭秘:Googlers 如何利用 Gemini 打造大会

原标题:How we used Gemini to build Google I/O 2026

速览

本文介绍了 Google 内部团队如何利用 Gemini 大模型技术来制作和呈现 Google I/O 2026 大会内容。通过展示 AI 在内容创作和会议组织中的实际应用,揭示了技术团队如何借助生成式 AI 提升效率并创新用户体验。

AI 深度解读

我们如何利用 Gemini 构建 Google I/O 2026

背景

Google I/O 2026 的核心主题聚焦于“以全新方式让 AI 为每个人提供帮助”。然而,Google 并没有仅仅停留在宣布 AI 创新成果上,而是选择将这些工具直接应用于 I/O 大会本身的筹备与制作中。

这是一个既奇异又令人兴奋的时刻。我们正经历着前所未有的技术变革,AI 工具每月都在进步,实质上正在重写我们所能创造事物的规则。今年,Google 团队向自己发起了挑战:使用即将在舞台上展示的同款 AI 技术,来超越自我,实现更快的创新、更高效的创作以及更卓越的执行力。

团队比以往任何时候都更快地移动,并进行了实时原型设计——将人类的艺术性与实验性技术相结合。其中最具代表性的案例便是短片《Timmy TPU》(又名《TPU Training Day》)。

这种方法的回报在于展示了这些工具如何释放创造力,并将枯燥的任务外包给 AI,从而让团队将最宝贵的时间回归到他们最擅长的人类独特工作中。当执行得当,活动本身就会令人惊叹,作为观众,你甚至不会意识到 AI 在其中扮演了角色。这种“隐形”的体验正是 Google 希望分享的机会,因为人们不断追问:“AI 到底能真正做什么?”

核心内容

Google 详细拆解了其在 I/O 2026 中使用的 AI 工具及具体的提示工程(Prompting)策略,主要涵盖以下四个领域:

1. AI x 电影制作:《TPU Training Day》短片

  • 使用的 AI 产品与模型:Google AI Studio、实验性 DeepMind 模型、Gemini Omni、Nano Banana。
  • 制作过程
    • 核心概念:团队试图回答一个问题:能否用最简单的材料(纸板和马克笔)制作一部动画电影,然后利用 AI 赋予其生命?
    • 人机协作:导演 Laurie Rowan 与 Nexus Studios 合作,将木偶戏、传统动画和 AI 融合。人类工艺和艺术性始终处于核心地位。
    • 技术流程
      1. 首先通过木偶戏和简单的 3D 动画捕捉角色表演,以完全控制构图和镜头运动。
      2. 使用 Nano Banana 从原始素材中生成风格化的第一帧。
      3. 为确保帧的一致性,团队在 Google AI Studio 内部构建了一个自定义工具,用于大规模测试 Nano Banana 生成的帧,确保在生成序列前达到像素级的匹配。
      4. 使用 Gemini Omni 和其他实验性模型合并基础动画与风格化帧,将电影提升至电影级质感,同时保留最初的人类意图。
    • 关键理念:保留微小的人类不完美之处是木偶电影魅力的来源,AI 管道的设计旨在保护这些细节。

2. AI x 视觉设计:I/O 视觉品牌标识

  • 使用的 AI 产品与模型:Gemini 模型、Nano Banana。
  • 制作过程
    • 品牌确立:最终确定了由四种颜色渐变、重叠透明度和互锁图标组成的视觉品牌标识。
    • 迭代优化
      1. 向 Gemini 模型输入过去的品牌指南和过去五年的 I/O 回顾视频。
      2. 早期输出未达预期,团队进行了微实验。
      3. 生成新图像,并将输出结果反馈给 Nano Banana 进行迭代,同时利用 Nano Banana 探索图标风格。
    • 最终成果:确定了从平面 2D 图标动态转换为超纹理 3D 图标的风格,确保在主题演讲、实体标牌和数字应用中保持品牌表达的一致性。

3. AI x 沉浸式体验:预演环节

A. Jellectronica:水母音乐实验

  • 使用的 AI 产品与模型:Google Antigravity、Google Colab、Google Coral NPU、Google Flow Music、Lyria 3 Pro。
  • 制作过程
    • 与蒙特雷湾水族馆合作,将月水母的运动转化为声音。
    • 追踪与控制:在 Google Colab 中训练 YOLO8 模型,并在 Google Coral NPU 上运行以追踪水母运动,从而控制音乐。
    • 音乐生成:使用 Google Flow Music 和 Lyria API 制作音乐。例如,低音部分的水母越多,低音就越响亮、越充满活力。
    • 自动化制作:在 Google Antigravity 中进行“氛围编码”(vibe-coding),构建批量音轨生成器,自动化生成贝斯、和弦、旋律和鼓点等音轨。

B. Infinite Scaler:无限缩放游戏

  • 使用的 AI 产品与模型:Google AI Studio、Gemini API、Gemini Canvas、Google Antigravity、Lyria 3、Nano Banana。
  • 制作过程
    • 核心玩法:玩家通过竞争生成无限 3D 世界。
    • 技术实现
      1. 利用 Nano Banana 通过 Gemini API 从用户提示和参考图像中生成精灵表(sprite sheets)。
      2. 将前景元素发回 Nano Banana 生成法线、粗糙度和自发光贴图,从而推断深度。
      3. 在 WebGL 渲染的 3D 纸盒上映射纹理,并添加到全球世界堆栈中。
      4. 使用 Google AI Studio 进行快速原型设计,随后迁移至 Google Antigravity 进行开发。
      5. 游戏内的音乐完全由 Lyria 3 生成。
    • Code the Countdown:全球创作者在 Canvas 或 AI Studio 中设计 1-10 的数字,并通过代码拼接成倒计时视频。

C. Antigravity Coffee Co. 快闪店

  • 使用的 AI 产品与模型:Flutter、Gemini Enterprise Agent Platform、Google Antigravity、Nano Banana。
  • 制作过程
    • 动态界面:使用生成式 UI 和 A2UI 协议与 Flutter 构建自适应界面,实时变化,取代静态表单。
    • 后端支持:Firebase 连接前端与 Nano Banana 等模型,处理复杂推理和内容生成。
    • 跨平台体验:单一的 Flutter 代码库在不同硬件上提供高质量、零延迟的体验。
    • 基础设施:依赖 Google Cloud 和 Firebase(包括 Cloud Functions、Firestore 和 Cloud Ops)解决构建和监控现代生成式 AI 应用的复杂性。
    • 用户参与:参会者利用 Google Antigravity 的智能体编码功能,快速构建自己的点单应用。

4. AI x 创意惊喜:演讲者标题卡

  • 使用的 AI 产品与模型:Gemini Omni、Google Flow、Nano Banana Pro。
  • 制作过程
    • 案例:Google Labs 和 Google Gemini 副总裁 Josh Woodward 的标题卡。
    • 流程
      1. 使用 Nano Banana Pro 生成核心资产(如成分参考表)。
      2. 利用这些成分进行分镜,尝试变体并添加个人细节。
      3. Google Flow 中,首先使用 Veo 原型化动作并生成动画(如扣篮)。
      4. 使用 Gemini Omni 生成动画,特别是在处理复杂的体育动作时非常有效。
      5. 详细的文本提示确保 AI 输出与参考表保持一致。
      6. 最后,将生成视频中的原始动作进行合成和时间重映射,制作成精美的标题。

关键要点

  • AI 作为生产力倍增器:Google 不仅展示 AI,更直接使用 AI 来构建 I/O 大会本身,证明了“吃自己的狗粮”(Dogfooding)策略在大型活动制作中的可行性。
  • **人机协作的核心地位
查看原文 →blog.google