技术博客Google AI Blog·2026/6/1

How we used Gemini to build Google I/O 2026

AI 深度解读

背景

Google I/O 2026 的核心主题是让 AI 以全新方式惠及每一个人。但 Google 不仅仅是在大会上发布 AI 创新——他们还用这些工具来打造大会本身。这篇文章由 Google AI Blog 发布，详细记录了 Google 团队如何用自家正在展示的 AI 工具来"超越自我"：更快地创新、更高效地创作。团队面临的挑战是：用舞台上的同一套 AI 工具来超越自身的极限。

核心内容

AI × 影片

《TPU Training Day》短片

使用的 AI 产品与模型：Google AI Studio、实验性 DeepMind 模型、Gemini Omni、Nano Banana

团队创作了一部以 TPU 为主角的短片，讲述一群 TPU 为 I/O 2026 做准备的故事。项目从一个问题出发：能否用最简单的材料——纸板和马克笔——制作动画影片，再用 AI 赋予其生命？团队与导演 Laurie Rowan 及 Nexus Studios 合作，将木偶、传统动画和 AI 融合在一起。

制作流程：首先通过木偶表演和简单 3D 动画捕捉角色表演，确保对构图和机位的完全掌控；然后用 Nano Banana 从原始素材生成风格化的首帧画面；为保证帧间一致性，团队在 Google AI Studio 内构建了自定义工具，大规模测试 Nano Banana 生成的帧，确保像素级匹配后再生成序列；最后用 Gemini Omni 和其他实验模型将基础动画与风格化帧融合，将影片提升至电影质感，同时保留人类创作的原始意图。团队强调，保留那些微小的人类"不完美"正是木偶片的魅力所在，而 AI 管线的设计初衷就是保护这些细节。

AI × 视觉设计

I/O 视觉品牌识别

使用的 AI 产品与模型：Gemini 模型、Nano Banana

团队为 I/O 2026 打造了视觉品牌识别系统——四色渐变叠加透明效果与交叠图标。品牌识别是团队与 AI 密切协作的成果：首先将过去五年的品牌指南和 I/O 回顾内容输入 Gemini 模型，早期输出未达预期后，团队进行了大量微实验，生成新图像并将输出结果连同反馈反复输入 Nano Banana 进行迭代，还利用 Nano Banana 探索图标风格。最终确定了从平面 2D 图标动态变换为超质感 3D 图标的方案，在主题演讲、实体标识和数字应用中形成统一的品牌表达。

AI × 沉浸式体验

预热秀：Jellectronica

使用的 AI 产品与模型：Google Antigravity、Google Colab、Google Coral NPU、Google Flow Music、Lyria 3 Pro

预热秀以 Jellectronica 开场——一个与蒙特雷湾水族馆合作的生成式音乐实验，利用 Lyria 3 Pro 将水母的运动转化为声音。团队在 Google Colab 中训练了 YOLO8 模型，然后在 Google Coral NPU 上运行，追踪水母运动来控制音乐——更多水母出现在低频区意味着更响亮、更有冲击力的低音。团队还在 Google Antigravity 中"氛围编码"了一个批量分轨生成器，自动化生成贝斯、和弦、旋律和鼓点等音轨。

预热秀：Infinite Scaler 与 Code the Countdown

使用的 AI 产品与模型：Google AI Studio、Gemini API、Gemini Canvas、Google Antigravity、Lyria 3、Nano Banana

Infinite Scaler 是一款边玩边生成关卡的视频游戏。团队希望玩家仅通过 2D 图像生成就能快速构建无限 3D 世界：利用 Nano Banana 通过 Gemini API 根据用户提示和参考图生成精灵表（sprite sheets）；将前景元素送回 Nano Banana 生成法线贴图、粗糙度和自发射贴图，推断深度信息后映射到 WebGL 渲染的 3D 纸盒纹理上，再添加到全球关卡堆栈中。团队先用 Google AI Studio 快速原型开发，再转入 Google Antigravity 进行正式开发，游戏音乐完全由 Lyria 3 生成。

Code the Countdown 则邀请全球创作者在 Canvas 或 AI Studio 中设计 1 到 10 的数字，再由代码拼接成一个倒计时动画。

Antigravity Coffee Co. 快闪店

使用的 AI 产品与模型：Flutter、Gemini Enterprise Agent Platform、Google Antigravity、Nano Banana

团队为 I/O 参会者打造了一款应用，可以设计和订购带有定制拉花的拿铁，还能构建自己版本的"最疯狂咖啡应用"。团队使用生成式 UI 和 A2UI 协议配合 Flutter 构建实时自适应界面，替代静态表单；Firebase 将前端与 Nano Banana 等模型桥接，处理复杂推理和内容生成；单一 Flutter 代码库跨硬件提供高质量、零延迟体验。参会者还使用 Google Antigravity 的智能体编程快速构建自己的点单应用。

AI × 创意惊喜

演讲者标题卡片

使用的 AI 产品与模型：Gemini Omni、Google Flow、Nano Banana Pro

每位演讲者都拥有专属的定制标题卡片。以 Google Labs 与 Google Gemini 副总裁 Josh Woodward 为例——参会者看到数字版 Josh 骑着 Chrome 小恐龙，随后扣篮得分。

制作流程：用 Nano Banana Pro 生成核心素材（如"配料参考表"），基于这些素材进行故事板创作，尝试变化并加入个人细节；在 Google Flow 中先用 Veo 原型化动作、生成扣篮等动画，也用 Gemini Omni 生成动画——在处理复杂运动时尤为有效；详细的文本提示确保 AI 输出与参考表一致；最后对生成视频中的原始运动进行合成和时间重映射，制成精美的标题卡片。

关键要点

AI 作为创作协作者而非替代者：所有项目都强调"人类工艺与实验性技术的融合"，AI 负责提升效率和实现不可能的效果，人类保留创意决策和艺术判断。
Nano Banana 是核心图像工具：贯穿影片、品牌设计、游戏精灵表、咖啡应用等多个场景，用于风格化生成、图标探索、贴图生成等。
Gemini Omni 负责多模态融合：在影片中用于融合基础动画与风格化帧，在标题卡片中处理复杂运动动画生成。
Google AI Studio 是快速原型中枢：团队在正式开发前用它进行大规模测试和快速迭代。
Google Antigravity 支撑智能体开发：从音乐分轨生成器到参会者自建咖啡应用，体现了智能体编程的灵活性。
Lyria 3 / Lyria 3 Pro 驱动生成式音乐：从水母运动转化的实验音乐到游戏配乐，生成式音频贯穿多个体验。
Coral NPU 实现边缘端实时推理：YOLO8 模型在 Coral NPU 上运行，实时追踪水母运动并控制音乐。
生成式 UI 与 A2UI 协议：Flutter 配合 A2UI 协议实现实时自适应界面，取代传统静态表单。
"保留人类不完美"的哲学：团队明确表示 AI 管线的设计目标是保护木偶片中那些微小的人类不完美，而非消除它们。

意义与影响

这篇文章的意义远超一次活动幕后花絮。它展示了一个关键转变：当 AI 工具使用得当时，观众不会意识到 AI 的存在——"活动本身足够精彩，作为观众你会停止思考 AI 是如何被使用的"。这正是 Google 想要分享的机会，因为人们一直在问"AI 到底能做什么？"

从实践层面看，这篇文章为行业提供了一份详尽的"AI 原生创作"工作流参考：从纸板木偶到电影级动画、从品牌识别系统到实时生成式游戏、从智能体驱动的快闪体验到生成式音乐——每个案例都附带了具体的工具链和提示词示例。这标志着 AI

查看原文 →blog.google