开源无限画布:集成多源API的统一AI图文视频创作网关
速览
该项目为开源的AI创作网关,旨在统一集成图、文、视频生成能力,兼容chatgpt2api、grok2api及OpenAI接口。近期更新增加了生图与视频创作工作台、后台用户及算力点管理,并优化了画布体验。未来计划支持PSD、PPT生成接口逆向及高分辨率生图修复。
AI 深度解读
背景
在当前的 AI 创作生态中,开发者与用户往往面临接口碎片化的问题。许多项目(如 chatgpt2api、grok2api、flow2api 等)各自为战,缺乏统一的图形化调试与创作界面。这导致用户在使用不同后端服务时,需要重复开发或适应不同的生图、视频生成在线调试功能,体验割裂且效率低下。
在此背景下,一个名为“开源无限画布”的项目应运而生。该项目旨在构建一个统一的 AI 创作网关,通过集成图/文生图、视频生成等功能,并提供兼容 2api 项目和 OpenAI 接口的无限画布体验。自上周开源以来,该项目在 GitHub 上迅速获得了 500 多 Star 的关注,显示出社区对统一化、可视化 AI 工作流工具的强烈需求。
核心内容
该项目是一个开源的无限画布平台,核心定位是作为公共的生图客户端,兼容各类 2api 项目(如 chatgpt2api、grok2api、flow2api)及 OpenAI 接口。其最新版本在上周开源的基础上进行了显著的功能迭代,主要涵盖以下几个方面:
1. 新增创作工作台 为了降低使用门槛并照顾移动端用户,项目新增了独立的工作台页面,分为“生图工作台”和“视频创作台”。
- 生图工作台:提供简洁的生图功能,无需使用复杂的画布逻辑,适合快速生成图像。
- 视频创作台:提供简洁的视频生成功能。目前视频生成接口采用 OpenAI 兼容标准,支持以下 API 调用:
POST /v1/videosGET /v1/videos/{id}GET /v1/videos/{id}/content
2. 画布功能升级
- 视频节点:在无限画布中新增了视频生成节点,实现了图文与视频生成的流程整合。
- 配置面板优化:优化了图像和视频生成的配置面板,修复了部分 Bug,提升了整体用户体验。
3. 后台管理与用户体系
- 用户登录:支持 Linux.do 账号登录,实现了与社区的深度集成。
- 算力点管理:引入了算力点机制,管理员可配置是否允许登录、每个模型消耗的算力点以及模型渠道。
- 系统设置:提供了完善的后台配置功能,包括 L 站登录信息配置等。
4. 提示词中心 项目后台增加了定时任务,自动爬取多个开源 GitHub 仓库的提示词资源。目前提示词中心已积累约一千多个提示词,丰富了用户的创作素材库。
5. 未来规划 开发者计划在下周重点修复 chatgpt2api 的 Bug,并持续为本项目提供接口支持。此外,还将进行以下接口的逆向工程开发:
- PSD 文件生成接口
- PPT 文件生成接口
- 深度搜索接口
其中,PSD 生成和 2k/4k 生图 Bug 修复将优先应用于本项目。
关键要点
- 统一网关定位:项目旨在解决多 2api 项目(chatgpt2api, grok2api, flow2api 等)接口分散问题,提供统一的生图/视频在线调试功能,避免重复开发。
- 兼容性强:兼容 OpenAI 接口标准,视频生成接口遵循 OpenAI 兼容规范(
/v1/videos系列接口)。 - 双模式体验:提供“无限画布”(适合复杂工作流)和“独立工作台”(适合简洁需求及移动端用户)两种使用模式。
- 社区化运营:支持 Linux.do 账号登录,集成社区算力点管理系统,并自动抓取开源提示词资源(目前约 1000+ 条)。
- 开源承诺:项目完全开源,无未开源部分,已获 LINUX DO 社区认可,并接受社区监督。
- 近期开发重点:下周将聚焦于 chatgpt2api 的 Bug 修复,以及 PSD、PPT 生成接口和深度搜索接口的逆向开发。
意义与影响
该项目的出现标志着 AI 创作工具向“平台化”和“标准化”迈出了重要一步。
首先,它降低了 AI 应用的集成成本。通过提供一个兼容多种 2api 和 OpenAI 接口的统一前端,开发者无需为每个后端服务单独开发图形化调试界面,极大地提升了开发效率。
其次,它丰富了用户的工作流体验。无限画布结合独立工作台的设计,兼顾了专业用户(需要复杂节点编排)和普通用户(需要快速生成)的需求。特别是视频生成节点的加入和 OpenAI 兼容接口的支持,使得用户在同一个平台内即可完成从文本到图像、再到视频的完整创作闭环。
最后,通过引入算力点管理和社区登录体系,该项目探索了 AI 服务商业化与社区运营结合的新模式,为开源 AI 项目的可持续发展提供了参考案例。随着 PSD、PPT 等更多办公类接口逆向功能的加入,该工具有望从单纯的创作工具扩展为综合性的 AI 办公辅助平台。
