MoneyPrinterTurbo:基于AI大模型的一键高清短视频生成工具
原标题:harry0703/MoneyPrinterTurbo
Python★ 61,762 stars+1,737 今日
速览
该项目利用AI大语言模型,支持一键生成包含配音、字幕和背景音乐的高清短视频。其核心亮点在于高度自动化与多平台适配,适用于自媒体运营、营销素材批量制作及个人创作者快速产出内容等场景。
AI 深度解读
这是什么
MoneyPrinterTurbo 是一款基于 Python 开发的开源 AI 视频生成工具,在 GitHub 上拥有超过 6.1 万星的高热度。它采用完整的 MVC 架构,代码结构清晰且易于维护,同时提供了 Web 界面和 API 接口,支持通过大语言模型(LLM)自动生成视频文案,并结合语音合成(TTS)、视频素材匹配及字幕渲染,实现从文案到成片的全流程自动化。
该项目兼容多种主流大模型(如 OpenAI、通义千问、DeepSeek、Moonshot 等)和语音合成服务,支持横屏(16:9)与竖屏(9:16)多种高清尺寸输出。其设计初衷是降低 AI 视频制作的门槛,让普通用户也能快速批量生成高质量短视频。
解决的问题
MoneyPrinterTurbo 主要解决了传统短视频制作中“内容创作难、制作周期长、技术门槛高”的痛点:
- 文案创作瓶颈:无需人工撰写脚本,AI 可根据主题自动生成中文或英文视频文案。
- 素材匹配繁琐:自动从 Pexels 等无版权高清素材库中检索并匹配视频片段,也可支持本地素材,解决了寻找和剪辑素材的耗时问题。
- 后期制作复杂:自动化处理字幕生成(支持 Edge 快速模式或 Whisper 高精度模式)、背景音乐混音、字体样式调整及视频合成,无需精通 Premiere 等专业软件。
- 批量生产需求:支持一次生成多个视频版本,供用户筛选最优结果,极大提升了内容迭代的效率。
核心功能
- 多模型接入:支持 OpenAI、Moonshot、Azure、GPT4Free、One-API、通义千问、Google Gemini、Ollama、DeepSeek、MiniMax、文心一言、Pollinations、ModelScope 等。
- 智能文案生成:支持 AI 自动生成文案或手动自定义,支持中/英双语。
- 高清视频输出:
- 竖屏 9:16 (1080x1920)
- 横屏 16:9 (1920x1080)
- 灵活的语音合成:支持多种 TTS 引擎,可实时试听效果,调整语速、音调。
- 精细化字幕控制:
- 支持两种生成方式:
edge(速度快、资源占用低)和whisper(质量更可靠、需下载约 3GB 模型)。 - 可自定义字体、位置、颜色、大小及描边设置。
- 支持两种生成方式:
- 素材与音频管理:
- 视频素材来源:Pexels 高清无版权素材或本地自定义文件夹。
- 背景音乐:支持随机选取或指定本地音乐文件,可独立调节音量。
- 批量生成:允许一次性生成多个视频片段,便于对比选择。
- 双端部署:提供 Web UI 界面和 RESTful API,方便集成到现有工作流。
亮点 / 与同类相比
-
极低的硬件门槛与灵活的部署方案:
- 非必需 GPU:若主要依赖云端 LLM 和 TTS,仅需 CPU 和较大内存即可运行,适合普通笔记本。
- GPU 加速可选:若启用本地
faster-whisper转录或批量本地处理,推荐使用带显存的独立显卡以提升速度。 - 多环境支持:提供 Windows 一键启动包(适合小白)、MacOS/Linux 源码部署、Docker 容器化部署以及 Google Colab 在线体验。
-
针对中国用户的优化:
- 推荐国内可直接访问且注册送额度的模型提供商(如 DeepSeek、Moonshot),无需翻墙即可使用高质量 LLM。
- 提供了国内网盘(百度网盘、夸克网盘)下载 Whisper 模型和一键启动包的渠道,解决网络访问 HuggingFace 困难的问题。
-
高度可定制性:
- 从视频尺寸、字幕样式到背景音乐音量,所有细节均可通过
config.toml配置文件进行精细调整。 - 支持 ImageMagick 和 FFmpeg 的本地路径自定义,解决环境依赖问题。
- 从视频尺寸、字幕样式到背景音乐音量,所有细节均可通过
-
清晰的架构与文档:
- 采用 MVC 架构,代码规范,便于二次开发。
- 提供详细的 API 文档(Swagger UI)和视频教程,降低学习成本。
适合谁用 / 上手
适合人群:
- 自媒体创作者:需要快速批量生产口播类、解说类短视频(如抖音、TikTok、YouTube Shorts)。
- 营销人员:需要低成本制作大量营销视频素材。
- 开发者:希望集成 AI 视频生成能力到自有平台或工作流中。
- AI 爱好者:希望本地部署并体验最新大模型与多模态技术。
上手指南:
-
新手快速体验(推荐 Windows 用户):
- 下载一键启动包(注意路径无中文/空格)。
- 解压后运行
update.bat更新代码,再运行start.bat启动。 - 浏览器访问自动打开的界面即可使用。
-
开发者本地部署(MacOS/Linux/高级 Windows 用户):
- 安装 Python 3.11 及
uv环境管理工具。 - 克隆仓库:
git clone https://github.com/harry0703/MoneyPrinterTurbo.git - 安装依赖:
uv sync --frozen - 配置
config.toml:填写 Pexels API Key 及 LLM Provider 的 API Key。 - 安装 ImageMagick(视频渲染必需)和 FFmpeg(视频处理必需)。
- 启动 Web 界面:
uv run streamlit run ./webui/Main.py - 启动 API 服务:
uv run python main.py
- 安装 Python 3.11 及
-
Docker 部署:
- 安装 Docker Desktop。
- 在项目根目录执行
docker compose up。 - 访问
http://0.0.0.0:8501(Web UI) 或http://0.0.0.0:8080/docs(API)。
注意事项:
- 确保网络通畅,若使用国内模型无需特殊网络设置,若使用 OpenAI 等需配置代理。
- 若使用 Whisper 生成字幕,需手动下载模型文件至指定目录。
- 路径中避免使用中文、特殊字符或空格,以防潜在的路径解析错误。
查看原文 →github.com
