
除此之外还推荐两个工具:
PDF: PDFMathTranslate
LaTex: gpt_academic
目录
一、为什么从 LaTeX 源码翻译?
阅读英文论文是日常工作的刚需。但直接阅读 PDF 往往存在以下问题:
- 语言障碍:英文不是母语的读者需要花费大量时间理解专业术语和句子结构
- 效率低下:逐字逐句翻译影响阅读效率,难以快速把握论文核心内容
- 术语困惑:专业领域的术语翻译不准确会导致理解偏差
传统的 PDF 翻译工具(如 Google Translate、DeepL 等)在处理学术论文时存在明显缺陷:
❌ 数学公式被破坏或丢失
❌ 图表标题和注释翻译混乱
❌ 代码块和算法伪码翻译错误
❌ 参考文献格式错乱
❌ 双栏排版变成单栏,影响阅读
LaTeX 源码翻译的优势:arXiv 上的绝大多数论文都提供了 LaTeX 源码,直接从源码出发进行翻译,可以完美保留:
- 数学公式的 LaTeX 代码(不翻译)
- 图表、代码块的结构(只翻译必要的 caption)
- 论文的排版格式和引用关系
- 章节结构和交叉引用
二、幻觉翻译(hjfy.top)- 在线翻译工具
2.1 工具简介
幻觉翻译(hjfy.top)是一个专门针对 arXiv 论文和学术文档的在线翻译工具。作者在知乎文章《消耗 3 亿 token,我用大模型翻译了 1 万篇 arXiv 论文》中详细介绍了开发历程。
网站地址:https://hjfy.top/
核心特点:
- 专门优化 arXiv 论文翻译
- 从 LaTeX 源码出发,保持格式完整
- 支持多种文档格式(Word、PDF、Epub)
- 持续优化和修复 bad case
2.2 使用方法
幻觉翻译的使用非常简单,无需任何配置:
方式一:直接使用 arXiv URL
- 访问 https://hjfy.top/
- 在输入框中粘贴 arXiv 论文 URL(如
https://arxiv.org/abs/2501.12345)或 论文ID:2501.12345 - 点击翻译按钮
- 等待翻译完成,下载生成的 PDF
方式二:上传文件
- 访问 https://hjfy.top/
- 选择上传 PDF 或 LaTeX 源码文件
- 等待处理和翻译
- 下载翻译结果
支持的输入格式:
- arXiv URL(自动获取源码)
- PDF 文件
- LaTeX 源码(.tex、.zip)
- Word 文档
- Epub 电子书
2.3 翻译效果
- 格式保持完美:公式、图表、引用结构完整
- 翻译质量稳定:经过大量论文训练,专业术语翻译准确
- 零配置使用:打开网页即可使用,无需安装任何软件
- 持续优化:作者每天针对翻译出错的 bad case 进行修复
- 免费使用:目前完全免费开放(目前:2026.01.31)
三、AI Agent 翻译方法 - 本地化方案
3.1 方法来源
苏剑林在 2026 年 1 月 28 日的博客《一行代码将arXiv论文翻译成中文版》中,介绍了一种基于 AI Agent 的本地化翻译方法。
3.2 技术原理
AI Agent 方法的技术优势在于:
自动化处理流程:
- 自动分析论文的目录结构
- 识别需要翻译的文件(.tex 文件)
- 逐段翻译,保持 LaTeX 代码可编译性
- 自动运行 xelatex 编译
- 根据编译错误自动调整翻译结果(关键优势!)
- 检查漏翻译的章节和文件
- 可开启多个 subagent 并行翻译
与人工规则编写的对比:
| 维度 | 人工规则编写 | AI Agent |
|---|---|---|
| 开发难度 | 极高,需要枚举所有情况 | 低,AI 自动判断 |
| 维护成本 | 持续修复 bad case | 自动适应和调整 |
| 编译错误处理 | 需要重写部分 LaTeX 编译器 | AI 自动修正 |
| 上下文理解 | 逐段翻译,无全局信息 | 全局上下文,质量更好 |
3.3 基本使用
前置条件
- 本地安装 kimi-cli 并配置 kimi-k2.5
- 安装 LaTeX 编译环境(MacTeX、TeX Live 等)
翻译命令示例
方式一:翻译已下载的源码
# 进入论文源码目录
cd paper_source/
# 执行翻译
kimi --print --prompt "你所在目录是一篇英文论文的latex源码,你需要做的是将论文翻译成中文版本,要求所有英文文字内容都翻译成中文,公式不变,表格、图片等只翻译必要的caption,代码框、算法框也只需翻译必要的注释,而人名不必翻译;将翻译后的新源码保存到当前目录下名为'paper_cn'的新目录中,要注意保持源码的可编译性;翻译完后要仔细检查一遍,看有没有漏翻译的章节和文件;最后,用xelatex将翻译结果重新编译成pdf,返回生成的pdf路径。如果翻译内容较多,应当开启多个subagent来并行翻译。"
方式二:从 arXiv 自动下载并翻译
kimi --print --prompt "从arXiv上下载id为2502.16982的论文源码,然后解压并将它翻译成中文版本,要求所有英文文字内容都翻译成中文,公式不变,表格、图片等只翻译必要的caption,代码框、算法框也只需翻译必要的注释,而人名不必翻译;将翻译后的新源码保存到解压目录下名为'paper_cn'的新目录中,要注意保持源码的可编译性;翻译完后要仔细检查一遍,看有没有漏翻译的章节和文件;最后,用xelatex将翻译结果重新编译成pdf,返回生成的pdf路径。如果翻译内容较多,应当开启多个subagent来并行翻译。"
效果示例
苏剑林提供了两篇论文的翻译对比(博客原文)
参考链接: