Others

基於螢幕截圖的 PDF 的問題

截取螢幕截圖並將其另存為 PDF 聽起來是一種捕獲內容的快速方法。對於單一圖像來說效果很好。作為建立文件的工作流程(電子表格的螢幕截圖、網頁的螢幕截圖、其他 PDF 的螢幕截圖),它產生的文件具有嚴重的實際限制,除非您嘗試對它們執行一些有用的操作,否則這些限制並不明顯。以下是出現問題的地方以及應該採取的措施。

The Problem With Screenshot-Based PDFs

基於螢幕截圖的 PDF 實際上包含什麼

螢幕截圖製作的 PDF 是一個包含一張或多張影像的容器。沒有文字層,沒有文件結構,沒有關於內容意義的元資料。螢幕截圖中可見的單字僅以像素形式存在——排列成看起來像字母的彩色點。該文件的語意內容並不比頁面照片更多。

這種區別——真實的文字與看起來像文字的像素——是接下來的每個問題的根本原因。 PDF 屏幕截图中的 PDF 质量 问题并不是 PDF 格式的失败;而是 PDF 格式的问题。這是在需要文件格式的情況下使用影像格式的基本限制。

WukongPDF

試試 PDF OCR

無需安裝。直接在您的瀏覽器中工作。

立即開始 →

你無法搜尋

在螢幕截圖 PDF 中按 Ctrl+F,搜尋什麼也沒找到。頁面上可見的文字不會作為可搜尋內容存在。如果您要建立研究文章、資料表或稍後需要引用的任何文件的 PDF,則無法在其中進行搜尋是一個重大的實際限制。

該檔案也不會出現在作業系統的內容搜尋中——只能按檔案名稱搜尋。螢幕截圖 PDF 的資料夾只能透過您的命名規則導航,沒有搜尋您記得在文件中的單字的後備方法。

基於螢幕截圖的 PDF 實際上包含什麼

屏幕截图以屏幕分辨率捕获内容 - 标准显示器上通常为 72 到 96 DPI。用於閱讀或列印的 PDF 文件應至少為 150 DPI;任何高品質列印都需要 300 DPI。屏幕截图 PDF 低于可靠打印质量的最低阈值,如果随后压缩 PDF,问题会更加复杂。

在 100% 縮放下在螢幕上看起來可以接受的文字在列印或放大時通常看起來明顯像素化。表格中的數字(對於準確閱讀尤其重要)在低解析度下可能會變得模糊。 「6」和「8」在原始解析度下可區分的內容在壓縮螢幕截圖 PDF 中可能看起來相同。

您無法從中複製文字

如果沒有 OCR,則無法從螢幕截圖 PDF 中選擇和複製圖形、引言、條款或任何其他內容。文字遊標要么不會出現,要么會選擇整個圖像作為一個區塊。任何收到文件並需要從中提取任何內容(將引用貼到報告中、將數字複製到電子表格中)的人都將面臨手動重新輸入。

該檔案也不會出現在作業系統的內容搜尋中——只能按檔案名稱搜尋。螢幕截圖 PDF 的資料夾只能透過您的命名規則導航,沒有搜尋您記得在文件中的單字的後備方法。

它不符合可訪問性要求

螢幕閱讀器 - 視力障礙人士使用的軟體 - 透過閱讀文件的文字內容來運作。屏幕截图 PDF 没有文本内容。螢幕閱讀器宣布文件已打開,然後沒有任何內容可供閱讀。在文件需要滿足可訪問性標準的專業或公共部門環境中,螢幕截圖 PDF 無法滿足所有適用的要求。這不是一個小問題——在許多司法管轄區,在可訪問的替代方案可行的情況下分發不可訪問的文件是一個合規問題。

除了截圖之外還能做什麼

正確的方法取決於您想要捕獲的內容:

  • 捕获网页:使用浏览器内置的打印>另存为 PDF 功能,或首先使用阅读器模式以获得更清晰的输出。結果包含真實文本,而不是像素。
  • 擷取電子表格:使用「檔案」>「直接從 Excel 或 Google Sheets 匯出」下載>> PDF。結果是格式正確的 PDF,具有正確解析度的真實文字。
  • 擷取另一個 PDF:使用分割工具提取您需要的頁面,而不是截圖。提取的頁面保留其原始解析度和文字層。
  • 檔案中已包含螢幕截圖 PDF: 透過 www.wukongpdf.com 上 WukongPDF 的 OCR PDF 工具執行它們,以新增可搜尋文字層。它不會恢復列印品質分辨率,但它使內容可搜尋和可複製。

螢幕截圖有其地位-只是不像文件

螢幕截圖對於捕捉視覺狀態非常有用 - 螢幕在某個時刻的樣子、UI bug、設計參考。對於創建文件記錄、參考資料或任何需要搜尋、複製、高品質列印或由使用輔助技術的人員存取的內容來說,它們是錯誤的工具。對於這些類別中的任何內容,請使用來源應用程式的匯出功能,而不是螢幕截圖捷徑。

WukongPDF

試試 PDF OCR

無需安裝。直接在您的瀏覽器中工作。

立即開始 →