翻译 PDF 比翻译网页或文本文件更复杂,因为 PDF 并不是为轻松的文本提取和编辑而设计的。最有效的方法取决于您拥有哪种类型的 PDF(带有真实文本的数字 PDF 或扫描文档)以及您需要多少翻译输出来保留原始格式。

为什么翻译 PDF 比听起来更棘手
翻译工具最适合使用可编辑文本——它们可以处理并以另一种语言返回的一串单词。 PDF 不是这样工作的。 PDF 是一种固定布局文档,其中文本以精确的坐标定位在页面上。即使 PDF 包含真实文本,将其干净地提取出来并将翻译后的文本放回相同位置在技术上也很困难。
扫描的 PDF 面临的挑战更加复杂,因为它根本不包含任何文本,仅包含文本图像。这些需要 OCR 才能进行任何翻译。对于布局复杂的文档(多列、表格、带有嵌入文本的图表),即使是好的翻译工具也很难保持原始结构。
尝试翻译 PDF
无需安装。直接在您的浏览器中工作。
选项 1:使用专用的 PDF 翻译工具
数字 PDF 最直接的途径是专门为 PDF 翻译构建的工具。 www.wukongpdf.com 上的 WukongPDF 的 Translate PDF 功能处理整个流程 — 上传 PDF,选择目标语言,然后下载翻译版本。该工具提取文本,翻译它,并尝试保留输出中的布局。
这种方法最适合布局简单的简单文档——报告、信件、文章、合同。复杂的多列布局和精心设计的文档可能需要在翻译后进行手动清理,因为翻译后的文本通常具有与原始文本不同的长度,并且可能会破坏列宽和分页符。
选项 2:转换为字、翻译、重新导出
为了更好地控制结果 - 特别是对于格式很重要的文档 - 首先将 PDF 转换为 Word,然后在 Word 中翻译,然后重新导出为 PDF。
- 步骤 1:使用 WukongPDF 的 PDF 到 Word 工具将 PDF 转换为 Word。这为您提供了一个可编辑的文档,您可以在翻译之前查看并修复任何提取问题。
- 步骤 2:使用 Microsoft Word 的内置翻译(审阅 > 翻译 > 翻译文档)或将内容粘贴到 DeepL 或 Google Translate 中。 Word 的翻译会使用翻译后的文本创建一个新文档,并保留基本格式。
- 第 3 步:查看翻译后的 Word 文档,修复所有格式问题,然后导出回 PDF。
此路线为您提供了最大的控制权并产生最干净的结果,但需要更多步骤。对于您将广泛分发的文档或需要在翻译版本中看起来很专业的文档,这是值得做的。
选项 3:谷歌翻译文档上传
谷歌翻译支持直接PDF上传。转至 translate.google.com,单击“文档”选项卡,上传 PDF,选择目标语言,然后单击“翻译”。谷歌返回了该文档的翻译版本,试图保留基本布局。
质量有利于快速理解文档的内容。它对于专业质量的输出来说不太可靠——格式通常会降低,复杂的布局会被破坏,并且翻译准确性因语言对而异。对于理解外语文件的内容来说,这是非常好的。为了生成要与他人共享的翻译文档,请在分发之前仔细检查。
翻译扫描的 PDF
扫描的 PDF 在翻译之前需要一个额外的步骤:OCR。文本图像必须先转换为实际文本,然后任何翻译工具才能处理它。首先通过 OCR 工具运行扫描的 PDF,然后继续执行上述任何翻译方法。
OCR 准确性会影响翻译质量——如果 OCR 误读源语言中的字符,这些误读字符的翻译就会错误。对于打印文档的干净扫描,OCR 非常准确。对于手写文档或质量较差的扫描,预计会出现更多错误,并计划仔细检查输出。
机器翻译的期望
机器翻译有了显着的改进,可以很好地处理大多数内容,尤其是西班牙语-英语、法语-英语、德语-英语和汉语-英语等常见语言对。为了理解文档的含义,机器翻译通常就足够了。
对于法律或医疗文件、正在签署的合同或任何精度至关重要的内容 - 使用机器翻译来理解文档,然后让人工翻译人员审阅最终版本。技术法律语言、惯用表达或特定文化内容的机器翻译可能会生成听起来看似合理但含义却微妙错误的文本。
尝试翻译 PDF
无需安装。直接在您的浏览器中工作。
