Tips & Tricks

如何將 PDF 文檔翻譯成英語

翻譯 PDF 比翻譯網頁或文字檔案更複雜,因為 PDF 並不是為輕鬆的文字擷取和編輯而設計的。最有效的方法取決於您擁有哪種類型的 PDF(帶有真實文字的數字 PDF 或掃描文件)以及您需要多少翻譯輸出來保留原始格式。

How to Translate a PDF Document to English

為什麼翻譯 PDF 比聽起來更棘手

翻譯工具最適合使用可編輯文字——它們可以處理並以另一種語言傳回的一串單字。 PDF 不是這樣運作的。 PDF 是一種固定佈局文檔,其中文字以精確的座標定位在頁面上。即使 PDF 包含真實文本,將其乾淨地提取出來並將翻譯後的文本放回相同位置在技術上也很困難。

掃描的 PDF 面臨的挑戰更加複雜,因為它根本不包含任何文本,僅包含文本圖像。這些需要 OCR 才能進行任何翻譯。對於佈局複雜的文件(多列、表格、帶有嵌入文字的圖表),即使是好的翻譯工具也很難保持原始結構。

WukongPDF

試試翻譯 PDF

無需安裝。直接在您的瀏覽器中工作。

立即開始 →

選項 1:使用專用的 PDF 翻譯工具

數字 PDF 最直接的途徑是專門為 PDF 翻譯建構的工具。 www.wukongpdf.com 上的 WukongPDF 的 Translate PDF 功能處理整個流程 — 上傳 PDF,選擇目標語言,然後下載翻譯版本。該工具提取文本,翻譯它,並嘗試保留輸出中的佈局。

這種方法最適合佈局簡單的簡單文件——報告、信件、文章、合約。複雜的多列佈局和精心設計的文件可能需要在翻譯後進行手動清理,因為翻譯後的文字通常具有與原始文字不同的長度,並且可能會破壞列寬和分頁符號。

選項 2:轉換為字、翻譯、重新匯出

為了更好地控制結果 - 特別是對於格式很重要的文件 - 首先將 PDF 轉換為 Word,然後在 Word 中翻譯,然後重新匯出為 PDF。

  • 步驟 1:使用 WukongPDF 的 PDF 到 Word 工具將 PDF 轉換為 Word。這為您提供了一個可編輯的文檔,您可以在翻譯之前查看並修復任何提取問題。
  • 步驟 2:使用 Microsoft Word 的內建翻譯(審查 > 翻譯 > 翻譯文件)或將內容貼到 DeepL 或 Google Translate 中。 Word 的翻譯會使用翻譯後的文字建立一個新文檔,並保留基本格式。
  • 第 3 步:查看翻譯後的 Word 文件,修復所有格式問題,然後匯出回 PDF。

此路線為您提供了最大的控制權並產生最乾淨的結果,但需要更多步驟。對於您將廣泛分發的文檔或需要在翻譯版本中看起來很專業的文檔,這是值得做的。

選項 3:Google翻譯文件上傳

谷歌翻譯支援直接PDF上傳。前往 translate.google.com,按一下「文件」選項卡,上傳 PDF,選擇目標語言,然後按一下「翻譯」。谷歌返回了該文件的翻譯版本,試圖保留基本佈局。

品質有利於快速理解文件的內容。它對於專業品質的輸出來說不太可靠——格式通常會降低,複雜的佈局會被破壞,並且翻譯準確性因語言對而異。對於理解外語文件的內容來說,這是非常好的。為了產生要與他人共享的翻譯文檔,請在分發之前仔細檢查。

翻譯掃描的 PDF

掃描的 PDF 在翻譯之前需要一個額外的步驟:OCR。文字圖像必須先轉換為實際文本,然後任何翻譯工具才能處理它。首先透過 OCR 工具執行掃描的 PDF,然後繼續執行上述任何翻譯方法。

OCR 準確性會影響翻譯品質——如果 OCR 誤讀原始語言中的字符,這些誤讀字符的翻譯就會錯誤。對於列印文件的乾淨掃描,OCR 非常準確。對於手寫文件或品質較差的掃描,預計會出現更多錯誤,並計劃仔細檢查輸出。

機器翻譯的期望

機器翻譯有了顯著的改進,可以很好地處理大多數內容,尤其是西班牙語-英語、法語-英語、德語-英語和漢語-英語等常見語言對。為了理解文件的含義,機器翻譯通常就足夠了。

對於法律或醫療文件、正在簽署的合約或任何精確度至關重要的內容 - 使用機器翻譯來理解文檔,然後讓人工翻譯人員審查最終版本。技術法律語言、慣用表達或特定文化內容的機器翻譯可能會產生聽起來看似合理但含義卻微妙錯誤的文字。

WukongPDF

試試翻譯 PDF

無需安裝。直接在您的瀏覽器中工作。

立即開始 →