Others

您可以將影像轉換為可搜尋的 PDF 嗎?

將圖像轉換為可搜尋的 PDF 是一個兩階段的過程:首先圖像變成 PDF,然後 OCR 新增文字圖層,以便可以搜尋和選擇內容。這兩個步驟可以在支援它的工具中一起完成,或者如果您希望對每個階段有更多的控制,也可以單獨完成。

Can You Convert an Image to a Searchable PDF?

常規影像PDF和可搜尋影像之間的差異

當您在不使用 OCR 的情況下將圖像轉換為 PDF 時,您會得到一個顯示該圖像的 PDF — 您可以打開它、放大、列印它 — 但您無法選擇文字、搜尋單字或複製內容。它本質上是一張包裹在 PDF 容器中的照片。可搜尋的 PDF 在圖像下方新增了一個隱藏文字圖層,該文字圖層是透過 OCR 讀取影像中的文字建立的。視覺外觀沒有變化,但現在 Ctrl+F 可以查找單字並且可以複製文字。

WukongPDF

嘗試 PDF OCR

無需安裝。直接在您的瀏覽器中工作。

立即開始 →

同時執行這兩個步驟

WukongPDF 的 OCR PDF 工具直接接受影像,而不僅僅是現有的 PDF。上傳 JPG、PNG 或 TIFF 文件,該工具會將其轉換為 PDF 並一步執行 OCR,返回可搜尋的 PDF。從影像檔案而不是現有的 PDF 開始時,這是最有效的路徑。

Google 雲端硬碟也可以一步處理此問題:將圖片上傳到雲端硬碟,右鍵點擊它,然後選擇開啟方式 → Google 文件。 Drive 轉換影像並自動執行 OCR。結果是一個可編輯的 Google 文檔,而不是可搜尋的 PDF,但如果需要,您可以從那裡下載為 PDF。

影像品質決定 OCR 準確性

OCR 讀取像素-輸入影像的品質直接決定文字辨識的準確度。 200 DPI 或以上的清晰、高對比度列印文件照片通常可以以非常高的精度進行轉換。無論您使用哪種 OCR 引擎,在光線不佳的情況下以某個角度拍攝的模糊手機照片都會出現許多錯誤。

如果您正在拍攝實體文件以建立可搜尋的 PDF,有幾件事可以顯著改善結果:平坦、均勻的照明,頁面上沒有陰影;相機位於文件正上方,而不是傾斜;並且文件是平放的而不是彎曲的。 Microsoft Lens 和 Adob​​e Scan 等手機掃描應用程式會在 OCR 之前應用自動透視校正和對比度增強,這就是為什麼它們通常會比標準相機照片產生更好的結果。

檢查輸出

轉換後,透過開啟 PDF 並嘗試按 Ctrl+F 輸入您在文件中看到的單字來驗證 OCR 是否有效。如果找到,則文字圖層可用。嘗試選擇一個段落並複製它 - 貼上到文字編輯器中以確認字元正確而不是亂碼。對於將要存檔或依賴搜尋的文檔,抽查幾頁 OCR 準確性是值得花費幾分鐘的。

OCR 之後的 PDF 壓縮 通道也可以幫助減小文件大小 - 全解析度圖像和嵌入文字層的組合可以產生比預期更大的文件,特別是對於多頁圖像掃描。

WukongPDF

嘗試 PDF OCR

無需安裝。直接在您的瀏覽器中工作。

立即開始 →