← 返回信息流
Agent SkillLINUX DO · AI·4 小时前

英文PDF一键变中文 开源论文翻译Skill保留排版

原标题:我做了个论文翻译 Skill:英文 PDF 一键变中文,还保留排版

速览

该开源项目提供论文翻译Skill,可直接在Claude Code/Codex中调用。用户放入英文PDF即可自动翻译成中文,尽量保持原论文的公式、图表、标题层级等排版。适合科研人员快速阅读英文论文、写综述前批量扫文献。底层调用大模型优化专业术语翻译,不是简单网页机翻。

AI 深度解读

背景

科研人员和学生在阅读英文论文时,最大的障碍往往不是语言本身,而是翻译工具破坏了原文的排版结构。公式、图表、标题层级、段落顺序等在传统翻译过程中经常被打乱,导致一篇论文翻译后变得难以获取有效信息。现有的大多数翻译工具(网页翻译、通用翻译插件)对学术论文中的专业术语和学术表达处理不够精细,且无法很好地保留原 PDF 的视觉结构。针对这一痛点,一位开发者基于 Claude Code / Codex 的工作流,制作了一个可自动完成论文翻译并保持排版的开源工具。

核心内容

该开源项目名为 pdf-translate(GitHub 仓库:L27z18328742/pdf-translate),核心是一个可以在 Claude CodeCodex 中直接调用的“论文翻译 Skill”。用户只需将英文 PDF 文件放入工作目录,通过一条指令触发,工具便会自动完成以下操作:

  • 调用底层大模型(针对论文的专业名词、学术表达做过优化)进行全文翻译,而非简单的网页级机器翻译。
  • 在翻译过程中尽量保持原论文的排版结构:包括公式、图表、标题层级、段落结构、参考文献引用等。
  • 输出结果为一篇中文论文,版式与原 PDF 接近,便于直接阅读和中英文对照。

工具面向的主要场景包括:快速阅读英文论文、写综述前批量扫文献、保留图表与公式的章节结构、中英文对照阅读等。开发者后续计划继续优化排版恢复的稳定性、术语一致性,并调整表达使其更符合中文阅读习惯。

项目已在 GitHub 上完整开源,用户可直接搜索 pdf-translate 或仓库名 L27z18328742/pdf-translate 获取。

关键要点

  • 工作流集成:该 Skill 运行在 Claude Code 或 Codex 环境内,用户通过一句指令即可启动,无需额外安装复杂的翻译软件或手动处理 PDF。
  • 排版保留:重点是翻译后保留原文的公式、图表、标题层级、段落结构,解决了现有翻译工具破坏排版的核心痛点。
  • 学术优化:底层大模型并非通用翻译引擎,而是专门针对论文中的专业名词、学术表达进行了优化,减少术语误译。
  • 开源与可复现:项目完整开源,用户可从 GitHub 获取代码并自行部署或修改,也可用于学习或二次开发。
  • 使用场景聚焦:面向科研人员、学生、综述撰写者等高频阅读英文论文的人群,降低入门阶段的英文阅读压力。
  • 持续改进计划:开发者明确表示后续将优化排版恢复的稳定性、提升术语一致性、改善中文表达的自然度。

意义与影响

该工具直接回应了学术阅读中一个长期被忽视的细节——翻译后的排版结构对信息获取效率的影响。通过将翻译能力深度嵌入开发者常用的 Claude Code / Codex 工作流,它使得批量处理、快速浏览论文成为可能,尤其适合需要大量扫读英文文献的综述阶段。开源许可进一步降低了使用门槛,也让社区可以共同参与改进术语一致性、排版稳定性等核心问题。从更广的视角看,这类“保留排版”的翻译工具可能推动学术文献翻译从“内容可读”向“结构可读”进化,让非母语读者在不丢失论文框架的前提下快速提取关键信息,从而提升整体科研产出效率。

查看原文 →linux.do