GitHub 热榜GitHub Trending · 日·22 小时前

LibreTranslate：免费开源的自托管机器翻译API

原标题：LibreTranslate/LibreTranslate

Python★ 14,833 stars+179 今日

速览

LibreTranslate 是一个完全免费且开源的机器翻译 API，支持自托管部署，确保数据完全私有化。它具备离线运行能力，易于搭建，适用于对数据隐私有高要求或无法连接外部翻译服务的场景。

AI 深度解读

这是什么

LibreTranslate 是一个完全开源、可自托管的机器翻译 API 服务。它由 Python 编写，在 GitHub 上获得了超过 14,000 颗星的关注，是开发者社区中备受瞩目的翻译基础设施项目。

与依赖 Google Translate、Microsoft Azure 或 DeepL 等商业闭源引擎的翻译服务不同，LibreTranslate 的核心翻译引擎基于开源库 Argos Translate。这意味着整个翻译链路——从底层模型推理到上层 API 接口——都是开放且透明的。用户可以在自己的服务器上部署该服务，实现数据的完全私有化，无需将敏感文本发送至第三方云端。

解决的问题

在当前的企业级应用和隐私敏感型开发场景中，LibreTranslate 主要解决了以下痛点：

数据隐私与合规性风险：许多商业翻译 API 要求将待翻译文本发送至其服务器进行处理。对于金融、法律、医疗或政府机构而言，这可能导致敏感数据泄露，违反 GDPR 等数据本地化法规。LibreTranslate 允许数据在本地闭环处理，彻底消除数据外泄风险。
供应商锁定（Vendor Lock-in）：依赖单一商业供应商（如 Google 或 Azure）意味着受制于其定价策略、API 调用限制以及服务可用性。一旦服务商更改条款或停止服务，迁移成本极高。LibreTranslate 提供了去中心化的替代方案，赋予开发者对基础设施的完全控制权。
离线与边缘计算需求：商业 API 必须联网才能使用。LibreTranslate 支持离线运行，使其能够嵌入到边缘设备、内网环境或无网络连接的安全隔离区中，满足特定的部署场景需求。
成本可控性：虽然商业 API 通常提供免费额度，但随着调用量增加，费用可能迅速攀升。自托管 LibreTranslate 主要消耗的是计算资源（CPU/GPU）和存储空间，对于高并发场景，长期来看往往更具成本效益，且无按次计费的不可预测性。

核心功能

RESTful API 接口：提供标准的 HTTP API，支持 GET 和 POST 请求，易于集成到任何支持 HTTP 调用的编程语言或框架中。
多语言支持：基于 Argos Translate 的模型库，支持数十种主要语言之间的互译，包括英语、中文、西班牙语、法语、德语、日语、韩语等。
自托管部署：提供 Docker 镜像，支持在 Linux、macOS 和 Windows 上快速部署。用户只需拥有服务器权限即可启动服务。
自定义模型加载：允许用户加载自定义的 Argos Translate 模型文件（.argosmodel），从而扩展支持特定领域或稀有语言对的翻译能力。
轻量级架构：核心服务非常轻量，资源占用相对较低，适合在资源受限的环境中运行。

亮点 / 与同类相比

关键亮点总结：

真正的自主权：不仅仅是“免费”，而是“自主”。你可以修改代码、优化模型、定制行为。
Argos Translate 驱动：作为其底层引擎，Argos Translate 是一个现代化的神经机器翻译库，支持多种后端（如 OpenNMT、Fairseq），保证了翻译质量的持续迭代。
社区驱动：拥有活跃的社区论坛和 GitHub 讨论区，问题响应迅速，功能迭代透明。

适合谁用 / 上手

适合人群：

注重数据隐私的企业：如金融机构、律师事务所、医疗机构，需要确保翻译内容不离开内网。
独立开发者与初创公司：希望避免早期 API 费用，或需要离线功能的移动应用开发者。
对供应商锁定敏感的组织：希望构建可移植、去中心化的技术栈。
研究人员与教育者：需要实验不同翻译模型或进行本地化 NLP 研究。

上手指南：

环境准备：确保服务器已安装 Docker 和 Docker Compose。
快速启动：
```
docker run -p 5000:5000 libretranslate/libretranslate
```
这将启动默认配置的服务，监听在 http://localhost:5000。

测试翻译：

curl -X POST http://localhost:5000/translate \
  -H "Content-Type: application/json" \
  -d '{"q":"Hello world","source":"en","target":"zh"}'

进阶配置：
- 通过挂载卷（Volume）持久化模型数据，避免每次重启重新下载。
- 配置环境变量以启用 API Key 认证，保护你的实例不被滥用。
- 使用 GPU 加速（如果硬件支持）以提升翻译吞吐量。

注意事项：

初始启动时，LibreTranslate 需要下载翻译模型文件，首次运行可能需要几分钟时间，具体取决于网络速度和所选语言对。
翻译质量虽好，但在处理极度专业或上下文复杂的文本时，可能仍略逊于 Google 或 DeepL 等商业巨头。建议根据实际业务场景进行质量评估。

查看原文 →github.com