开源AI互动剧情游戏InfiPlot内测免费,多模态实时生成沉浸式体验
原标题:【开源】【最幻想的一集】AI 实时生成所有图文内容的交互式剧情游戏,内测期间免费玩,体验可视化、沉浸式、个性化的“参与式幻想”
速览
清华大学等高校团队开源互动剧情游戏InfiPlot,内测期间免费体验。该项目采用多Agent架构,结合多模态大模型实时生成剧情分支、AI绘图及个性化TTS配音。旨在打造可视化、沉浸式的“参与式幻想”交互体验,支持一键部署。
AI 深度解读
背景
互动剧情类游戏(如《完蛋!我被美女包围了!》、《千恋万花》、《底特律:变人》)拥有庞大的受众基础,其核心魅力在于玩家通过选择推动剧情发展,获得沉浸式的参与感。然而,传统互动游戏受限于固定剧本和预设分支,难以实现无限延展的剧情和个性化的体验。
近期,flipbook 发布了一种基于多模态模型的全新 UI 交互形态,展示了 AI 在实时生成图文内容方面的潜力。受此启发,开发者团队萌生了构建一个能够实时生成所有图文内容、支持无限长度剧情的交互式剧情游戏的项目。该项目名为 InfiPlot,旨在通过 AI 技术实现“参与式幻想”,让玩家在可视化、沉浸式的体验中探索无穷的故事可能性。目前该项目已开源,并在内测期间提供免费体验。
核心内容
InfiPlot 是一个基于多智能体(Multi-Agent)架构的交互式剧情游戏平台,其核心逻辑是让用户通过选择或点击场景中的特定位置来推动剧情发展。每个故事由一系列场景组成,每个场景包含一张 AI 绘制的背景图和一个情节树,情节树中定义了剧情分支、人物对话及交互选项。
1. 多智能体协作架构
为了实现剧情的连贯性、角色一致性和高质量叙事,InfiPlot 采用了多智能体协作机制。系统内部定义了五种职能角色,各自具备行业专业知识:
- 架构师:负责整体故事框架。
- 编剧:学习电影行业知识,设计跌宕起伏的情节。
- 角色设计师:塑造人物性格与背景。
- 场景布置师:规划场景逻辑。
- 画家:负责生成视觉内容。 这些智能体相互配合,共同编排和交付前端显示的内容。
2. 技术实现细节
- 语音合成(TTS):
- 初期尝试了 edge-tts,效果不佳;随后尝试 MiniMax 的 TTS 模型,但因音色定制成本高昂(3元/次)且效果未达预期而放弃。
- 最终选用 mimo-v2.5-tts 系列模型。该模型免费且质量较高,能够根据角色人设生成不同音色(如可爱妹子使用“kawaii”音色,班主任使用沉稳音色),并能根据剧情情绪动态调整声音(如愤怒大叫或娇羞)。
- 由于 mimo TTS 存在 RPM(每分钟请求数)限制,未来计划开放前端自定义 API Key 功能并申请更高限额。
- 图像生成:
- 生图是技术难度最高的环节,需平衡低延迟、低成本与高质量。
- 测试了 z-image-turbo 和 flux.2 9b(通过 runware.ai 调用)。z-image-turbo 虽速度快但无法上传多张参考图,难以保证角色一致性。
- 最终选定 flux.2 9b,单图成本约为 $0.00078,理论出图速度可达 0.5s,实测在 2s 内。
- 当前挑战在于小参数模型可能导致角色出现“三只手”或重影等瑕疵,团队正在寻求优化方案。
3. 交互与体验
- 交互方式:除了传统的选项点击,用户还可以点击场景图中的任意位置触发交互,系统会根据点击位置生成新的剧情分支。
- 当前体验评估:开发者坦言目前体验评分约为 60 分。建议用户优先体验类似“红果短剧”风格的无脑爽文剧情(如“穿越回研一发表 Nature”),而非追求豆瓣 Top 250 级别的深度叙事。
- 未来规划:Roadmap 中包含自定义交互输入、图生视频实现动态场景、预制游戏功能(以时间换质量)以及发布 Steam 精品游戏等计划。
关键要点
- 项目性质:InfiPlot 是完全开源的交互式剧情游戏平台,支持 Vercel 和 Cloudflare 一键部署,内测期间免费。
- 核心架构:采用多智能体(Multi-Agent)系统,包含架构师、编剧、角色设计师、场景布置师、画家五个职能,以提升内容质量。
- TTS 选型:最终选用免费的 mimo-v2.5-tts 模型,实现了基于人设和情绪动态变化的语音合成,解决了早期模型成本高或效果差的问题。
- 生图方案:选用 flux.2 9b 模型以平衡成本与一致性,单图成本极低($0.00078),但需解决小参数模型带来的图像瑕疵问题。
- 交互创新:支持点击场景任意位置触发非预设剧情分支,参考了 flipbook 的交互理念,旨在实现更自由的“参与式幻想”。
- 团队背景:团队成员来自清华大学、兰州大学、西安交大等高校,目前为兼职远程开发,正在招募新成员。
- 局限性:当前生成内容的质量尚无法与专业编剧作品竞争,更适合轻松、快节奏的剧情体验;图像一致性仍有提升空间。
意义与影响
InfiPlot 的出现标志着 AI 在互动娱乐领域的一次重要探索。它证明了通过多模态大模型和多智能体协作,可以实时生成具有连贯性和个性化的图文内容,从而打破传统互动游戏受限于固定剧本的瓶颈。
- 降低创作门槛:通过自动化生成剧情、图像和语音,大幅降低了互动内容创作的成本和技术门槛,使得个人或小团队也能制作出具备一定沉浸感的游戏内容。
- 推动交互范式变革:从“选择预设分支”向“点击任意位置触发动态剧情”演进,参考 flipbook 的理念,这种交互方式更接近真实的社交互动,提升了用户的沉浸感和参与感。
- 技术选型的参考价值:项目在 TTS 和生图模型上的选型过程(从 edge-tts、MiniMax 到 mimo 和 flux.2 9b)为其他开发者提供了宝贵的实战经验,特别是在平衡成本、速度和质量的权衡上。
- 社区驱动开发:项目通过开源和社区推广(如 LINUX DO),积极收集用户反馈并招募成员,展示了开源社区在 AI 应用创新中的活力。虽然当前体验仍有不足,但其“以时间换质量”和“预制游戏”的未来规划,为 AI 生成内容(AIGC)在高质量娱乐产品中的应用提供了新的思路。
查看原文 →linux.do
