AI PDF 翻译 PDFMathTranslate(持续更新)

PDFMathTranslate 是 EMNLP 2025 演示项目,专注科学论文 PDF 翻译,在翻译的同时保留公式、图表、目录、注释等排版布局,非常适合阅读英文论文。

核心特性

  • 布局保留:公式、图表、目录、注释等尽量保持原样
  • 多语言:支持中英日韩等多语种互译
  • 多翻译引擎:Google、DeepL、OpenAI、百度等
  • 多种用法:命令行、Web UI、Docker、Zotero 插件

安装与使用

方式一:pip 安装

# Python 3.10 ~ 3.12
pip install pdf2zh

# 翻译单个 PDF
pdf2zh document.pdf

# 启动图形界面
pdf2zh -i
# 浏览器访问 http://localhost:7860

方式二:uv 安装(推荐)

pip install uv
uv tool install --python 3.12 pdf2zh
pdf2zh document.pdf

方式三:Docker

docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh
# 访问 http://localhost:7860

常用参数

参数 说明 示例
-i 启动 Web UI pdf2zh -i
-p 只翻译部分页 pdf2zh example.pdf -p 1-5
-li 源语言 pdf2zh example.pdf -li en
-lo 目标语言 pdf2zh example.pdf -lo zh
-s 翻译服务 pdf2zh example.pdf -s deepl
-o 输出目录 pdf2zh example.pdf -o output
--dir 批量翻译 pdf2zh --dir /path/to/pdfs/

国内网络问题

若模型下载失败,可设置 HuggingFace 镜像:

# Linux/macOS
export HF_ENDPOINT=https://hf-mirror.com

# Windows PowerShell
$env:HF_ENDPOINT = "https://hf-mirror.com"

在线试用

官方资料