GitHub 热榜GitHub Trending · 日·7 天前

MoneyPrinterTurbo：基于AI大模型的一键高清短视频生成工具

原标题：harry0703/MoneyPrinterTurbo

Python★ 61,762 stars+1,737 今日

速览

该项目利用AI大语言模型，支持一键生成包含配音、字幕和背景音乐的高清短视频。其核心亮点在于高度自动化与多平台适配，适用于自媒体运营、营销素材批量制作及个人创作者快速产出内容等场景。

AI 深度解读

这是什么

MoneyPrinterTurbo 是一款基于 Python 开发的开源 AI 视频生成工具，在 GitHub 上拥有超过 6.1 万星的高热度。它采用完整的 MVC 架构，代码结构清晰且易于维护，同时提供了 Web 界面和 API 接口，支持通过大语言模型（LLM）自动生成视频文案，并结合语音合成（TTS）、视频素材匹配及字幕渲染，实现从文案到成片的全流程自动化。

该项目兼容多种主流大模型（如 OpenAI、通义千问、DeepSeek、Moonshot 等）和语音合成服务，支持横屏（16:9）与竖屏（9:16）多种高清尺寸输出。其设计初衷是降低 AI 视频制作的门槛，让普通用户也能快速批量生成高质量短视频。

解决的问题

MoneyPrinterTurbo 主要解决了传统短视频制作中“内容创作难、制作周期长、技术门槛高”的痛点：

文案创作瓶颈：无需人工撰写脚本，AI 可根据主题自动生成中文或英文视频文案。
素材匹配繁琐：自动从 Pexels 等无版权高清素材库中检索并匹配视频片段，也可支持本地素材，解决了寻找和剪辑素材的耗时问题。
后期制作复杂：自动化处理字幕生成（支持 Edge 快速模式或 Whisper 高精度模式）、背景音乐混音、字体样式调整及视频合成，无需精通 Premiere 等专业软件。
批量生产需求：支持一次生成多个视频版本，供用户筛选最优结果，极大提升了内容迭代的效率。

核心功能

多模型接入：支持 OpenAI、Moonshot、Azure、GPT4Free、One-API、通义千问、Google Gemini、Ollama、DeepSeek、MiniMax、文心一言、Pollinations、ModelScope 等。
智能文案生成：支持 AI 自动生成文案或手动自定义，支持中/英双语。
高清视频输出：
- 竖屏 9:16 (1080x1920)
- 横屏 16:9 (1920x1080)
灵活的语音合成：支持多种 TTS 引擎，可实时试听效果，调整语速、音调。
精细化字幕控制：
- 支持两种生成方式：edge（速度快、资源占用低）和 whisper（质量更可靠、需下载约 3GB 模型）。
- 可自定义字体、位置、颜色、大小及描边设置。
素材与音频管理：
- 视频素材来源：Pexels 高清无版权素材或本地自定义文件夹。
- 背景音乐：支持随机选取或指定本地音乐文件，可独立调节音量。
批量生成：允许一次性生成多个视频片段，便于对比选择。
双端部署：提供 Web UI 界面和 RESTful API，方便集成到现有工作流。

亮点 / 与同类相比

极低的硬件门槛与灵活的部署方案：
- 非必需 GPU：若主要依赖云端 LLM 和 TTS，仅需 CPU 和较大内存即可运行，适合普通笔记本。
- GPU 加速可选：若启用本地 faster-whisper 转录或批量本地处理，推荐使用带显存的独立显卡以提升速度。
- 多环境支持：提供 Windows 一键启动包（适合小白）、MacOS/Linux 源码部署、Docker 容器化部署以及 Google Colab 在线体验。
针对中国用户的优化：
- 推荐国内可直接访问且注册送额度的模型提供商（如 DeepSeek、Moonshot），无需翻墙即可使用高质量 LLM。
- 提供了国内网盘（百度网盘、夸克网盘）下载 Whisper 模型和一键启动包的渠道，解决网络访问 HuggingFace 困难的问题。
高度可定制性：
- 从视频尺寸、字幕样式到背景音乐音量，所有细节均可通过 config.toml 配置文件进行精细调整。
- 支持 ImageMagick 和 FFmpeg 的本地路径自定义，解决环境依赖问题。
清晰的架构与文档：
- 采用 MVC 架构，代码规范，便于二次开发。
- 提供详细的 API 文档（Swagger UI）和视频教程，降低学习成本。

适合谁用 / 上手

适合人群：

自媒体创作者：需要快速批量生产口播类、解说类短视频（如抖音、TikTok、YouTube Shorts）。
营销人员：需要低成本制作大量营销视频素材。
开发者：希望集成 AI 视频生成能力到自有平台或工作流中。
AI 爱好者：希望本地部署并体验最新大模型与多模态技术。

上手指南：

新手快速体验（推荐 Windows 用户）：
- 下载一键启动包（注意路径无中文/空格）。
- 解压后运行 update.bat 更新代码，再运行 start.bat 启动。
- 浏览器访问自动打开的界面即可使用。
开发者本地部署（MacOS/Linux/高级 Windows 用户）：
- 安装 Python 3.11 及 uv 环境管理工具。
- 克隆仓库：git clone https://github.com/harry0703/MoneyPrinterTurbo.git
- 安装依赖：uv sync --frozen
- 配置 config.toml：填写 Pexels API Key 及 LLM Provider 的 API Key。
- 安装 ImageMagick（视频渲染必需）和 FFmpeg（视频处理必需）。
- 启动 Web 界面：uv run streamlit run ./webui/Main.py
- 启动 API 服务：uv run python main.py
Docker 部署：
- 安装 Docker Desktop。
- 在项目根目录执行 docker compose up。
- 访问 http://0.0.0.0:8501 (Web UI) 或 http://0.0.0.0:8080/docs (API)。

注意事项：

确保网络通畅，若使用国内模型无需特殊网络设置，若使用 OpenAI 等需配置代理。
若使用 Whisper 生成字幕，需手动下载模型文件至指定目录。
路径中避免使用中文、特殊字符或空格，以防潜在的路径解析错误。

查看原文 →github.com