← 返回信息流
AI 资讯雷峰网·3 小时前

阿里发布世界模型HappyOyster 1.0,支持实时互动与导演

原标题:阿里发布世界模型HappyOyster 1.0,用户可实时探索、导演并重塑 AI 世界

速览

阿里发布可实时构建和交互的开放式世界模型HappyOyster 1.0,具备世界探索和实时导演两大核心能力。该模型能主动推演因果链并保持长程一致性,用户可通过一句话或一张图生成可互动的数字世界。HappyOyster 1.0正探索交互式游戏、虚拟陪伴等新形态,并联合南京大学打造行业基准。

AI 深度解读

背景

随着生成式 AI 技术的快速演进,从文本生成图像(Text-to-Image)到文本生成视频(Text-to-Video),AI 内容创作的能力边界不断拓展。然而,传统的文生视频模型主要侧重于从输入文字到生成视频的单向映射,缺乏用户介入和实时互动的能力。与此同时,世界模型(World Models)作为 AI 领域的新兴赛道,旨在学习物理世界状态转移规律,实现从“当前状态/动作”到“下一状态/动作”的推演。尽管大语言模型架构日趋成熟,但世界模型仍处于早期探索阶段,且业界缺乏可量化的测评标准。在此背景下,阿里巴巴于 6 月 17 日正式发布了其开放式世界模型产品 HappyOyster 1.0,试图在实时构建、交互及因果推演方面取得突破。

核心内容

HappyOyster 1.0 是阿里发布的一款可实时构建和交互的开放式世界模型产品。该产品深度学习物理世界状态转移规律,能够主动推演从动作到反馈的因果链,并保持人物和环境的长程一致性。与传统的文生视频模型不同,HappyOyster 1.0 的核心优势在于其支持用户在任意节点介入,改变数字世界的走向,实现了从单向生成到双向实时互动的转变。

该模型具备两大核心能力:世界探索(Adventure)和实时导演(Directing)。

世界探索模式下,用户仅需输入一句话或上传一张图片,即可生成可深度探索的数字世界。该模式支持长达 1 分钟的连续实时位移与镜头控制。交互功能得到了显著升级,新增了前冲、下蹲、跳跃、攻击等操控按键,丰富了人物的运动轨迹,并支持载具驾驶与武器战斗等复杂物理交互。

实时导演模式下,用户获得“上帝视角”,能够暂停、回溯并分支叙事。用户可以在体验过程中的任意节点暂停,回跳至剧情关键节点,输入新的提示词来改变剧情走向。该模式支持生成 3 分钟以上的 480p 或 720p 实时画面,实现了用低成本让同一开局衍生出无限可能的互动体验。

HappyOyster 1.0 的技术原理在于从海量自然视频中学习现实里人物、事物和环境的演变。通过自主推演因果链,模型能够自然迁移到未见过的场景,根据用户指令推理出新的因果,并维持数字世界的长程稳定和音视频的长时协同。

目前,HappyOyster 1.0 官网已开放用户注册体验,并计划近期全面开放 API 接口。阿里正联合南京大学,着手打造首个覆盖过程交互、跨模态对齐、长程一致与物理仿真验证的行业基准,以填补世界模型测评标准的空白。

关键要点

  • 产品定位:HappyOyster 1.0 是阿里发布的开放式世界模型,旨在实现可实时构建、交互和重塑的 AI 数字世界。
  • 技术差异:区别于文生视频模型的单向映射,HappyOyster 1.0 学习的是状态转移规律,支持用户实时介入和因果推演。
  • 核心功能升级
    • 新增攻击、跳跃、剧情回溯、剧情分支等操控能力。
    • 世界探索模式支持复杂物理交互(如载具驾驶、武器战斗)。
    • 实时导演模式支持暂停、回溯及分支叙事,允许用户改写画面、角色和剧情。
  • 应用场景
    • 交互式游戏:开发者可通过图片和提示词快速生成符合物理规律的开放世界原型,无需耗费大量时间编写代码。
    • 互动短剧/虚拟陪伴/直播:将传统线性叙事转化为用户掌握主动权的互动体验。
    • 文旅体验:提供沉浸式探索,生成稳定一致性的数字人 IP,允许游客决定游览路线及进入奇幻场景。
  • 行业贡献:阿里联合南京大学打造世界模型行业基准,涵盖过程交互、跨模态对齐、长程一致与物理仿真验证。
  • 开放计划:官网已开放体验,近期将全面开放 API 接口,携手行业共建生态。

意义与影响

HappyOyster 1.0 的发布标志着 AI 内容生成从“被动观看”向“主动交互”的重要跨越。对于内容创作者而言,该模型极大地降低了交互式内容的开发门槛。在交互式游戏领域,开发者无需耗费数周甚至数月进行代码编写和测试,即可快速生成开放世界原型;在互动短剧和直播领域,用户能够通过自然语言指令实时改写剧情,这种非线性的叙事方式有望重塑娱乐内容的消费形态。

此外,HappyOyster 1.0 在技术层面推动了世界模型这一新兴赛道的发展。通过建立涵盖过程交互和物理仿真验证的行业基准,阿里正在尝试解决世界模型缺乏统一测评标准的问题,为后续的技术迭代和商业化落地奠定基础。随着 API 接口的全面开放,HappyOyster 1.0 有望在文旅、虚拟陪伴等多个行业激发新的生产力,推动多模态互动内容形态的普及与创新。

查看原文 →leiphone.com