每日一个开源AI工具之PDFMathTranslate
AI PDF 翻译 PDFMathTranslate(持续更新)
PDFMathTranslate 是 EMNLP 2025 演示项目,专注科学论文 PDF 翻译,在翻译的同时保留公式、图表、目录、注释等排版布局,非常适合阅读英文论文。
核心特性
- 布局保留:公式、图表、目录、注释等尽量保持原样
- 多语言:支持中英日韩等多语种互译
- 多翻译引擎:Google、DeepL、OpenAI、百度等
- 多种用法:命令行、Web UI、Docker、Zotero 插件
安装与使用
方式一:pip 安装
# Python 3.10 ~ 3.12
pip install pdf2zh
# 翻译单个 PDF
pdf2zh document.pdf
# 启动图形界面
pdf2zh -i
# 浏览器访问 http://localhost:7860
方式二:uv 安装(推荐)
pip install uv
uv tool install --python 3.12 pdf2zh
pdf2zh document.pdf
方式三:Docker
docker pull byaidu/pdf2zh
docker run -d -p 7860:7860 byaidu/pdf2zh
# 访问 http://localhost:7860
常用参数
| 参数 | 说明 | 示例 |
|---|---|---|
-i |
启动 Web UI | pdf2zh -i |
-p |
只翻译部分页 | pdf2zh example.pdf -p 1-5 |
-li |
源语言 | pdf2zh example.pdf -li en |
-lo |
目标语言 | pdf2zh example.pdf -lo zh |
-s |
翻译服务 | pdf2zh example.pdf -s deepl |
-o |
输出目录 | pdf2zh example.pdf -o output |
--dir |
批量翻译 | pdf2zh --dir /path/to/pdfs/ |
国内网络问题
若模型下载失败,可设置 HuggingFace 镜像:
# Linux/macOS
export HF_ENDPOINT=https://hf-mirror.com
# Windows PowerShell
$env:HF_ENDPOINT = "https://hf-mirror.com"
在线试用
- 官方免费服务:https://pdf2zh.com/
- HuggingFace Spaces:可搜索 PDFMathTranslate
- ModelScope:https://www.modelscope.cn/studios/AI-ModelScope/PDFMathTranslate
官方资料
- 仓库:https://github.com/PDFMathTranslate/PDFMathTranslate
- 高级用法:仓库内
docs/ADVANCED.md - API 文档:
docs/APIS.md