在保持格式完整的同時翻譯 PDF 確實很困難 - 比大多數人預期的要困難。挑戰不在於翻譯本身,而在於翻譯本身。這是因為 PDF 是一種固定佈局格式,其設計目的並不是要替換其文字。誠實的答案是您可以接近,但格式保存的程度在很大程度上取決於原始文件的複雜性。

為什麼PDF翻譯比看起來更難
PDF 將文字儲存為頁面上的定位字符,而不是可重排的段落。當您翻譯文字時,字數和字元數幾乎總是會改變。英語文本的西班牙文翻譯通常要長 20-30%。德語還可以更長。中文或日文翻譯通常較短。交換不同長度的翻譯文字會破壞圍繞原始文字長度設計的佈局。
除此之外,PDF 本身不支援從右到左閱讀的阿拉伯語或希伯來語等複雜腳本,原始字體可能不包含目標語言所需的字符,並且 PDF 編輯器中的翻譯文本通常不會像文字處理器那樣重排 - 並且複雜性變得顯而易見。
嘗試翻譯 PDF
無需安裝。直接在您的瀏覽器中工作。
最可靠的方法:轉換、翻譯、匯出
對於準確翻譯和清晰格式都很重要的文檔,最佳工作流程是:將 PDF 轉換為 Word,翻譯 Word 文檔,然後匯出回 PDF。這為您的翻譯步驟提供了合適的文字處理器 - 文字正確重排,樣式應用一致,並且您可以完全控制佈局。
轉換步驟最適合具有簡單版面的文字文件(報告、合約、文章)。具有多列、文字方塊、表格和嵌入圖形的複雜佈局在轉換後需要手動格式化工作,因為 Word 無法完美地重建每個 PDF 佈局。
WukongPDF 的 PDF Converter 工具處理 PDF 到 Word 的步驟,之後您可以使用 DeepL、Google Translate 的文檔上傳功能或手動在 Word 中進行翻譯,然後將翻譯後的文檔導出回 PDF。
使用專用PDF翻譯工具
現在有幾種工具提供直接 PDF 翻譯 - 您上傳 PDF 並收到翻譯後的 PDF。 DeepL 和 Google Translate 都支援 PDF 檔案上傳。這些工具嘗試在替換文字的同時保留佈局。對於簡單的、文字較多且格式最少的文檔,結果通常相當不錯。對於複雜的佈局、表格或列間距較小的文檔,格式經常會被破壞。
這些工具的翻譯品質已顯著提高,並且對於大多數常見語言對來說通常是準確的。主要變數是格式保真度,而不是翻譯準確性。
「保持格式」在實務上的實際意義
對於大多數翻譯用例,「保持格式」是最重要的。意思是:標題看起來像標題,段落可讀,表格保持表格不變,文件可導航。它不一定意味著原始佈局的像素完美再現,特別是當目標語言明顯長於或短於來源語言時。
如果您需要翻譯後的文件在視覺上與原始文件相同(相同的分頁符號、相同的列寬、相同的文字位置),那麼您正在尋找專業的桌面出版工作,而不是簡單的文件轉換。這是對已出版資料的合理要求;對於內部文件或參考翻譯來說這有點過分了。
翻譯掃描的PDFs
掃描的 PDF 需要額外的步驟:首先進行 OCR 提取文本,然後進行翻譯。如果沒有 OCR,翻譯工具會看到沒有文字的圖像。透過 OCR 工具執行掃描的 PDF,得到文字圖層 PDF 或 Word 文檔,然後正常進行翻譯。
對於掃描文件來說,翻譯後的格式保存基本上無法保證——掃描本身就是圖像,圍繞翻譯文字重建佈局需要手動重建。對於只關心含義(而不是外觀)的掃描文檔,透過 OCR 提取文字並將其翻譯為純文字速度更快,並且設定更現實的期望。
將方法與文件相符
簡單的文字文檔,格式很重要:使用直接 PDF 翻譯工具並檢查輸出。簡單的文字文檔,格式並不重要:提取文字、翻譯、作為單獨的純語言版本分發。複雜的版面、格式設定問題:轉換為 Word、翻譯、重新格式化、匯出為 PDF。掃描文件:首先進行 OCR,然後使用適合複雜程度的方法進行翻譯。
沒有任何一種工具能夠同樣出色地處理所有這些問題。在開始之前了解您所處的情況可以節省嘗試不適用於您的特定文件的方法所花費的時間。
嘗試翻譯 PDF
無需安裝。直接在您的瀏覽器中工作。
