← 返回信息流
技术博客Google AI Blog·2026/6/1

How we used Gemini to build Google I/O 2026

AI 深度解读

背景

Google I/O 2026 的核心主题是让 AI 以全新方式惠及每一个人。但 Google 不仅仅是在大会上发布 AI 创新——他们还用这些工具来打造大会本身。这篇文章由 Google AI Blog 发布,详细记录了 Google 团队如何用自家正在展示的 AI 工具来"超越自我":更快地创新、更高效地创作。团队面临的挑战是:用舞台上的同一套 AI 工具来超越自身的极限。

核心内容

AI × 影片

《TPU Training Day》短片

使用的 AI 产品与模型:Google AI Studio、实验性 DeepMind 模型、Gemini Omni、Nano Banana

团队创作了一部以 TPU 为主角的短片,讲述一群 TPU 为 I/O 2026 做准备的故事。项目从一个问题出发:能否用最简单的材料——纸板和马克笔——制作动画影片,再用 AI 赋予其生命?团队与导演 Laurie Rowan 及 Nexus Studios 合作,将木偶、传统动画和 AI 融合在一起。

制作流程:首先通过木偶表演和简单 3D 动画捕捉角色表演,确保对构图和机位的完全掌控;然后用 Nano Banana 从原始素材生成风格化的首帧画面;为保证帧间一致性,团队在 Google AI Studio 内构建了自定义工具,大规模测试 Nano Banana 生成的帧,确保像素级匹配后再生成序列;最后用 Gemini Omni 和其他实验模型将基础动画与风格化帧融合,将影片提升至电影质感,同时保留人类创作的原始意图。团队强调,保留那些微小的人类"不完美"正是木偶片的魅力所在,而 AI 管线的设计初衷就是保护这些细节。

AI × 视觉设计

I/O 视觉品牌识别

使用的 AI 产品与模型:Gemini 模型、Nano Banana

团队为 I/O 2026 打造了视觉品牌识别系统——四色渐变叠加透明效果与交叠图标。品牌识别是团队与 AI 密切协作的成果:首先将过去五年的品牌指南和 I/O 回顾内容输入 Gemini 模型,早期输出未达预期后,团队进行了大量微实验,生成新图像并将输出结果连同反馈反复输入 Nano Banana 进行迭代,还利用 Nano Banana 探索图标风格。最终确定了从平面 2D 图标动态变换为超质感 3D 图标的方案,在主题演讲、实体标识和数字应用中形成统一的品牌表达。

AI × 沉浸式体验

预热秀:Jellectronica

使用的 AI 产品与模型:Google Antigravity、Google Colab、Google Coral NPU、Google Flow Music、Lyria 3 Pro

预热秀以 Jellectronica 开场——一个与蒙特雷湾水族馆合作的生成式音乐实验,利用 Lyria 3 Pro 将水母的运动转化为声音。团队在 Google Colab 中训练了 YOLO8 模型,然后在 Google Coral NPU 上运行,追踪水母运动来控制音乐——更多水母出现在低频区意味着更响亮、更有冲击力的低音。团队还在 Google Antigravity 中"氛围编码"了一个批量分轨生成器,自动化生成贝斯、和弦、旋律和鼓点等音轨。

预热秀:Infinite Scaler 与 Code the Countdown

使用的 AI 产品与模型:Google AI Studio、Gemini API、Gemini Canvas、Google Antigravity、Lyria 3、Nano Banana

Infinite Scaler 是一款边玩边生成关卡的视频游戏。团队希望玩家仅通过 2D 图像生成就能快速构建无限 3D 世界:利用 Nano Banana 通过 Gemini API 根据用户提示和参考图生成精灵表(sprite sheets);将前景元素送回 Nano Banana 生成法线贴图、粗糙度和自发射贴图,推断深度信息后映射到 WebGL 渲染的 3D 纸盒纹理上,再添加到全球关卡堆栈中。团队先用 Google AI Studio 快速原型开发,再转入 Google Antigravity 进行正式开发,游戏音乐完全由 Lyria 3 生成。

Code the Countdown 则邀请全球创作者在 Canvas 或 AI Studio 中设计 1 到 10 的数字,再由代码拼接成一个倒计时动画。

Antigravity Coffee Co. 快闪店

使用的 AI 产品与模型:Flutter、Gemini Enterprise Agent Platform、Google Antigravity、Nano Banana

团队为 I/O 参会者打造了一款应用,可以设计和订购带有定制拉花的拿铁,还能构建自己版本的"最疯狂咖啡应用"。团队使用生成式 UI 和 A2UI 协议配合 Flutter 构建实时自适应界面,替代静态表单;Firebase 将前端与 Nano Banana 等模型桥接,处理复杂推理和内容生成;单一 Flutter 代码库跨硬件提供高质量、零延迟体验。参会者还使用 Google Antigravity 的智能体编程快速构建自己的点单应用。

AI × 创意惊喜

演讲者标题卡片

使用的 AI 产品与模型:Gemini Omni、Google Flow、Nano Banana Pro

每位演讲者都拥有专属的定制标题卡片。以 Google Labs 与 Google Gemini 副总裁 Josh Woodward 为例——参会者看到数字版 Josh 骑着 Chrome 小恐龙,随后扣篮得分。

制作流程:用 Nano Banana Pro 生成核心素材(如"配料参考表"),基于这些素材进行故事板创作,尝试变化并加入个人细节;在 Google Flow 中先用 Veo 原型化动作、生成扣篮等动画,也用 Gemini Omni 生成动画——在处理复杂运动时尤为有效;详细的文本提示确保 AI 输出与参考表一致;最后对生成视频中的原始运动进行合成和时间重映射,制成精美的标题卡片。

关键要点

  • AI 作为创作协作者而非替代者:所有项目都强调"人类工艺与实验性技术的融合",AI 负责提升效率和实现不可能的效果,人类保留创意决策和艺术判断。
  • Nano Banana 是核心图像工具:贯穿影片、品牌设计、游戏精灵表、咖啡应用等多个场景,用于风格化生成、图标探索、贴图生成等。
  • Gemini Omni 负责多模态融合:在影片中用于融合基础动画与风格化帧,在标题卡片中处理复杂运动动画生成。
  • Google AI Studio 是快速原型中枢:团队在正式开发前用它进行大规模测试和快速迭代。
  • Google Antigravity 支撑智能体开发:从音乐分轨生成器到参会者自建咖啡应用,体现了智能体编程的灵活性。
  • Lyria 3 / Lyria 3 Pro 驱动生成式音乐:从水母运动转化的实验音乐到游戏配乐,生成式音频贯穿多个体验。
  • Coral NPU 实现边缘端实时推理:YOLO8 模型在 Coral NPU 上运行,实时追踪水母运动并控制音乐。
  • 生成式 UI 与 A2UI 协议:Flutter 配合 A2UI 协议实现实时自适应界面,取代传统静态表单。
  • "保留人类不完美"的哲学:团队明确表示 AI 管线的设计目标是保护木偶片中那些微小的人类不完美,而非消除它们。

意义与影响

这篇文章的意义远超一次活动幕后花絮。它展示了一个关键转变:当 AI 工具使用得当时,观众不会意识到 AI 的存在——"活动本身足够精彩,作为观众你会停止思考 AI 是如何被使用的"。这正是 Google 想要分享的机会,因为人们一直在问"AI 到底能做什么?"

从实践层面看,这篇文章为行业提供了一份详尽的"AI 原生创作"工作流参考:从纸板木偶到电影级动画、从品牌识别系统到实时生成式游戏、从智能体驱动的快闪体验到生成式音乐——每个案例都附带了具体的工具链和提示词示例。这标志着 AI

查看原文 →blog.google