← 返回信息流
GitHub 热榜GitHub Trending · 日·7 天前

MoneyPrinterTurbo:基于AI大模型的一键高清短视频生成工具

原标题:harry0703/MoneyPrinterTurbo
Python61,762 stars+1,737 今日

速览

该项目利用AI大语言模型,支持一键生成包含配音、字幕和背景音乐的高清短视频。其核心亮点在于高度自动化与多平台适配,适用于自媒体运营、营销素材批量制作及个人创作者快速产出内容等场景。

AI 深度解读

这是什么

MoneyPrinterTurbo 是一款基于 Python 开发的开源 AI 视频生成工具,在 GitHub 上拥有超过 6.1 万星的高热度。它采用完整的 MVC 架构,代码结构清晰且易于维护,同时提供了 Web 界面和 API 接口,支持通过大语言模型(LLM)自动生成视频文案,并结合语音合成(TTS)、视频素材匹配及字幕渲染,实现从文案到成片的全流程自动化。

该项目兼容多种主流大模型(如 OpenAI、通义千问、DeepSeek、Moonshot 等)和语音合成服务,支持横屏(16:9)与竖屏(9:16)多种高清尺寸输出。其设计初衷是降低 AI 视频制作的门槛,让普通用户也能快速批量生成高质量短视频。

解决的问题

MoneyPrinterTurbo 主要解决了传统短视频制作中“内容创作难、制作周期长、技术门槛高”的痛点:

  1. 文案创作瓶颈:无需人工撰写脚本,AI 可根据主题自动生成中文或英文视频文案。
  2. 素材匹配繁琐:自动从 Pexels 等无版权高清素材库中检索并匹配视频片段,也可支持本地素材,解决了寻找和剪辑素材的耗时问题。
  3. 后期制作复杂:自动化处理字幕生成(支持 Edge 快速模式或 Whisper 高精度模式)、背景音乐混音、字体样式调整及视频合成,无需精通 Premiere 等专业软件。
  4. 批量生产需求:支持一次生成多个视频版本,供用户筛选最优结果,极大提升了内容迭代的效率。

核心功能

  • 多模型接入:支持 OpenAI、Moonshot、Azure、GPT4Free、One-API、通义千问、Google Gemini、Ollama、DeepSeek、MiniMax、文心一言、Pollinations、ModelScope 等。
  • 智能文案生成:支持 AI 自动生成文案或手动自定义,支持中/英双语。
  • 高清视频输出
    • 竖屏 9:16 (1080x1920)
    • 横屏 16:9 (1920x1080)
  • 灵活的语音合成:支持多种 TTS 引擎,可实时试听效果,调整语速、音调。
  • 精细化字幕控制
    • 支持两种生成方式:edge(速度快、资源占用低)和 whisper(质量更可靠、需下载约 3GB 模型)。
    • 可自定义字体、位置、颜色、大小及描边设置。
  • 素材与音频管理
    • 视频素材来源:Pexels 高清无版权素材或本地自定义文件夹。
    • 背景音乐:支持随机选取或指定本地音乐文件,可独立调节音量。
  • 批量生成:允许一次性生成多个视频片段,便于对比选择。
  • 双端部署:提供 Web UI 界面和 RESTful API,方便集成到现有工作流。

亮点 / 与同类相比

  1. 极低的硬件门槛与灵活的部署方案

    • 非必需 GPU:若主要依赖云端 LLM 和 TTS,仅需 CPU 和较大内存即可运行,适合普通笔记本。
    • GPU 加速可选:若启用本地 faster-whisper 转录或批量本地处理,推荐使用带显存的独立显卡以提升速度。
    • 多环境支持:提供 Windows 一键启动包(适合小白)、MacOS/Linux 源码部署、Docker 容器化部署以及 Google Colab 在线体验。
  2. 针对中国用户的优化

    • 推荐国内可直接访问且注册送额度的模型提供商(如 DeepSeek、Moonshot),无需翻墙即可使用高质量 LLM。
    • 提供了国内网盘(百度网盘、夸克网盘)下载 Whisper 模型和一键启动包的渠道,解决网络访问 HuggingFace 困难的问题。
  3. 高度可定制性

    • 从视频尺寸、字幕样式到背景音乐音量,所有细节均可通过 config.toml 配置文件进行精细调整。
    • 支持 ImageMagick 和 FFmpeg 的本地路径自定义,解决环境依赖问题。
  4. 清晰的架构与文档

    • 采用 MVC 架构,代码规范,便于二次开发。
    • 提供详细的 API 文档(Swagger UI)和视频教程,降低学习成本。

适合谁用 / 上手

适合人群:

  • 自媒体创作者:需要快速批量生产口播类、解说类短视频(如抖音、TikTok、YouTube Shorts)。
  • 营销人员:需要低成本制作大量营销视频素材。
  • 开发者:希望集成 AI 视频生成能力到自有平台或工作流中。
  • AI 爱好者:希望本地部署并体验最新大模型与多模态技术。

上手指南:

  1. 新手快速体验(推荐 Windows 用户)

    • 下载一键启动包(注意路径无中文/空格)。
    • 解压后运行 update.bat 更新代码,再运行 start.bat 启动。
    • 浏览器访问自动打开的界面即可使用。
  2. 开发者本地部署(MacOS/Linux/高级 Windows 用户)

    • 安装 Python 3.11 及 uv 环境管理工具。
    • 克隆仓库:git clone https://github.com/harry0703/MoneyPrinterTurbo.git
    • 安装依赖:uv sync --frozen
    • 配置 config.toml:填写 Pexels API Key 及 LLM Provider 的 API Key。
    • 安装 ImageMagick(视频渲染必需)和 FFmpeg(视频处理必需)。
    • 启动 Web 界面:uv run streamlit run ./webui/Main.py
    • 启动 API 服务:uv run python main.py
  3. Docker 部署

    • 安装 Docker Desktop。
    • 在项目根目录执行 docker compose up
    • 访问 http://0.0.0.0:8501 (Web UI) 或 http://0.0.0.0:8080/docs (API)。

注意事项:

  • 确保网络通畅,若使用国内模型无需特殊网络设置,若使用 OpenAI 等需配置代理。
  • 若使用 Whisper 生成字幕,需手动下载模型文件至指定目录。
  • 路径中避免使用中文、特殊字符或空格,以防潜在的路径解析错误。
查看原文 →github.com