技术博客Google AI Blog·2 天前

Google I/O 2026 揭秘：Googlers 如何利用 Gemini 打造大会

原标题：How we used Gemini to build Google I/O 2026

速览

本文介绍了 Google 内部团队如何利用 Gemini 大模型技术来制作和呈现 Google I/O 2026 大会内容。通过展示 AI 在内容创作和会议组织中的实际应用，揭示了技术团队如何借助生成式 AI 提升效率并创新用户体验。

AI 深度解读

我们如何利用 Gemini 构建 Google I/O 2026

背景

Google I/O 2026 的核心主题聚焦于“以全新方式让 AI 为每个人提供帮助”。然而，Google 并没有仅仅停留在宣布 AI 创新成果上，而是选择将这些工具直接应用于 I/O 大会本身的筹备与制作中。

这是一个既奇异又令人兴奋的时刻。我们正经历着前所未有的技术变革，AI 工具每月都在进步，实质上正在重写我们所能创造事物的规则。今年，Google 团队向自己发起了挑战：使用即将在舞台上展示的同款 AI 技术，来超越自我，实现更快的创新、更高效的创作以及更卓越的执行力。

团队比以往任何时候都更快地移动，并进行了实时原型设计——将人类的艺术性与实验性技术相结合。其中最具代表性的案例便是短片《Timmy TPU》（又名《TPU Training Day》）。

这种方法的回报在于展示了这些工具如何释放创造力，并将枯燥的任务外包给 AI，从而让团队将最宝贵的时间回归到他们最擅长的人类独特工作中。当执行得当，活动本身就会令人惊叹，作为观众，你甚至不会意识到 AI 在其中扮演了角色。这种“隐形”的体验正是 Google 希望分享的机会，因为人们不断追问：“AI 到底能真正做什么？”

核心内容

Google 详细拆解了其在 I/O 2026 中使用的 AI 工具及具体的提示工程（Prompting）策略，主要涵盖以下四个领域：

1. AI x 电影制作：《TPU Training Day》短片

使用的 AI 产品与模型：Google AI Studio、实验性 DeepMind 模型、Gemini Omni、Nano Banana。
制作过程：
- 核心概念：团队试图回答一个问题：能否用最简单的材料（纸板和马克笔）制作一部动画电影，然后利用 AI 赋予其生命？
- 人机协作：导演 Laurie Rowan 与 Nexus Studios 合作，将木偶戏、传统动画和 AI 融合。人类工艺和艺术性始终处于核心地位。
- 技术流程：
  1. 首先通过木偶戏和简单的 3D 动画捕捉角色表演，以完全控制构图和镜头运动。
  2. 使用 Nano Banana 从原始素材中生成风格化的第一帧。
  3. 为确保帧的一致性，团队在 Google AI Studio 内部构建了一个自定义工具，用于大规模测试 Nano Banana 生成的帧，确保在生成序列前达到像素级的匹配。
  4. 使用 Gemini Omni 和其他实验性模型合并基础动画与风格化帧，将电影提升至电影级质感，同时保留最初的人类意图。
- 关键理念：保留微小的人类不完美之处是木偶电影魅力的来源，AI 管道的设计旨在保护这些细节。

2. AI x 视觉设计：I/O 视觉品牌标识

使用的 AI 产品与模型：Gemini 模型、Nano Banana。
制作过程：
- 品牌确立：最终确定了由四种颜色渐变、重叠透明度和互锁图标组成的视觉品牌标识。
- 迭代优化：
  1. 向 Gemini 模型输入过去的品牌指南和过去五年的 I/O 回顾视频。
  2. 早期输出未达预期，团队进行了微实验。
  3. 生成新图像，并将输出结果反馈给 Nano Banana 进行迭代，同时利用 Nano Banana 探索图标风格。
- 最终成果：确定了从平面 2D 图标动态转换为超纹理 3D 图标的风格，确保在主题演讲、实体标牌和数字应用中保持品牌表达的一致性。

3. AI x 沉浸式体验：预演环节

A. Jellectronica：水母音乐实验

使用的 AI 产品与模型：Google Antigravity、Google Colab、Google Coral NPU、Google Flow Music、Lyria 3 Pro。
制作过程：
- 与蒙特雷湾水族馆合作，将月水母的运动转化为声音。
- 追踪与控制：在 Google Colab 中训练 YOLO8 模型，并在 Google Coral NPU 上运行以追踪水母运动，从而控制音乐。
- 音乐生成：使用 Google Flow Music 和 Lyria API 制作音乐。例如，低音部分的水母越多，低音就越响亮、越充满活力。
- 自动化制作：在 Google Antigravity 中进行“氛围编码”（vibe-coding），构建批量音轨生成器，自动化生成贝斯、和弦、旋律和鼓点等音轨。

B. Infinite Scaler：无限缩放游戏

使用的 AI 产品与模型：Google AI Studio、Gemini API、Gemini Canvas、Google Antigravity、Lyria 3、Nano Banana。
制作过程：
- 核心玩法：玩家通过竞争生成无限 3D 世界。
- 技术实现：
  1. 利用 Nano Banana 通过 Gemini API 从用户提示和参考图像中生成精灵表（sprite sheets）。
  2. 将前景元素发回 Nano Banana 生成法线、粗糙度和自发光贴图，从而推断深度。
  3. 在 WebGL 渲染的 3D 纸盒上映射纹理，并添加到全球世界堆栈中。
  4. 使用 Google AI Studio 进行快速原型设计，随后迁移至 Google Antigravity 进行开发。
  5. 游戏内的音乐完全由 Lyria 3 生成。
- Code the Countdown：全球创作者在 Canvas 或 AI Studio 中设计 1-10 的数字，并通过代码拼接成倒计时视频。

C. Antigravity Coffee Co. 快闪店

使用的 AI 产品与模型：Flutter、Gemini Enterprise Agent Platform、Google Antigravity、Nano Banana。
制作过程：
- 动态界面：使用生成式 UI 和 A2UI 协议与 Flutter 构建自适应界面，实时变化，取代静态表单。
- 后端支持：Firebase 连接前端与 Nano Banana 等模型，处理复杂推理和内容生成。
- 跨平台体验：单一的 Flutter 代码库在不同硬件上提供高质量、零延迟的体验。
- 基础设施：依赖 Google Cloud 和 Firebase（包括 Cloud Functions、Firestore 和 Cloud Ops）解决构建和监控现代生成式 AI 应用的复杂性。
- 用户参与：参会者利用 Google Antigravity 的智能体编码功能，快速构建自己的点单应用。

4. AI x 创意惊喜：演讲者标题卡

使用的 AI 产品与模型：Gemini Omni、Google Flow、Nano Banana Pro。
制作过程：
- 案例：Google Labs 和 Google Gemini 副总裁 Josh Woodward 的标题卡。
- 流程：
  1. 使用 Nano Banana Pro 生成核心资产（如成分参考表）。
  2. 利用这些成分进行分镜，尝试变体并添加个人细节。
  3. 在 Google Flow 中，首先使用 Veo 原型化动作并生成动画（如扣篮）。
  4. 使用 Gemini Omni 生成动画，特别是在处理复杂的体育动作时非常有效。
  5. 详细的文本提示确保 AI 输出与参考表保持一致。
  6. 最后，将生成视频中的原始动作进行合成和时间重映射，制作成精美的标题。

关键要点

AI 作为生产力倍增器：Google 不仅展示 AI，更直接使用 AI 来构建 I/O 大会本身，证明了“吃自己的狗粮”（Dogfooding）策略在大型活动制作中的可行性。
**人机协作的核心地位

查看原文 →blog.google