Others

您可以將掃描的 PDF 轉換為 Excel 嗎?

是的 - 但與轉換數字創建的 PDF 相比,它需要額外的步驟。掃描的 PDF 是圖像,而不是具有結構化資料的文檔,因此轉換過程必須先識別圖像中的文字和數字,然後才能將其放入電子表格單元格中。如果效果良好,可以節省大量時間。如果沒有,則需要進行清理。

Can You Convert a Scanned PDF to Excel?

為什麼掃描的 PDF 不同

數字創建的 PDF 將資料儲存為實際字元 - 可以直接讀取並放入單元格的數字。掃描的 PDF 將頁面儲存為照片。 「數字」是指掃描的表格中的像素恰好看起來像數字。要將它們提取到 Excel 中,軟體必須查看這些像素,確定它們代表什麼字符,然後找出表格的結構 - 哪些像素形成行,哪些像素形成列,以及單元格邊界在哪裡。

這個過程(光學字元辨識與表格結構偵測結合)比簡單的 PDF 到 Excel 轉換更複雜,更容易出現錯誤。

WukongPDF

嘗試 PDF 轉 Excel

無需安裝。直接在您的瀏覽器中工作。

立即開始 →

影響轉換品質的因素

掃描品質是最重要的因素。在 200+ DPI 下對清晰列印的表格進行乾淨、高對比度的掃描可以很好地轉換 — OCR 可以準確讀取字元並且可以識別表格結構。低解析度掃描、褪色的文件、傾斜的頁面或任何單元格中的手寫數字都會產生明顯更差的結果。

表結構的複雜性也很重要。具有清晰邊框和一致行高的簡單網格比具有合併單元格、跨越標題、巢狀子表或不同高度的行的複雜表格更可靠地進行轉換。更簡單的結構意味著轉換軟體必須做出的決策更少,這些決策出錯的機會也更少。

如何做

WukongPDF 的 PDF 到 Excel 工具直接處理掃描的 PDF — OCR 步驟會自動執行轉換的一部分。上傳掃描的 PDF,選擇 Excel 作為輸出格式,然後下載。對於結構良好的表的乾淨掃描,輸出通常只需最少的清理即可使用。開啟 Excel 文件,檢查數據,更正任何 OCR 錯誤(誤讀字元、合併或分割儲存格),然後電子表格就可以使用了。

Adobe Acrobat Pro 具有特別強大的掃描 PDF 到 Excel 轉換功能,具有比大多數免費工具更好的表格偵測功能。如果您有權存取它並且文件很複雜,那麼即使您在其他地方進行清理,也值得將其用於初始轉換。

轉換後要檢查的內容

切勿相信未經審查的掃描 PDF 轉換,尤其是對於數位資料。 OCR 通常會混淆某些字元對:0 和 O、1 和 l、5 和 S、8 和 B。如果財務表中的某些零被讀作字母 O,則會導致公式損壞和總計不正確。在將資料用於任何重要的事情之前,根據原始掃描抽查關鍵資料。

檢查列對齊:當原始表格的間距不規則或合併儲存格時,轉換有時會將資料放置在錯誤的列中。逐頁比較 Excel 輸出的結構與原始掃描結果,而不僅僅是抽查各個值。

當手動輸入更快時

對於非常短的表(低於 20 行)或結構複雜且轉換效果不佳的表,手動資料輸入有時比轉換加清理更快。一個 10 行 5 列的表格大約需要 3 分鐘來輸入;如果轉換產生的結果需要進行重大修正,那麼您比直接輸入花費了更多的時間。

對於長表(數十或數百行,其中手動輸入需要花費數小時),轉換方法的回報最為明顯。對於這些,即使是不完美的清理轉換也幾乎總是比從頭開始更快。

WukongPDF

嘗試 PDF 轉 Excel

無需安裝。直接在您的瀏覽器中工作。

立即開始 →