PDF 檔案可以包含兩種根本不同類型的視覺內容:光柵和向量。大多數 PDF 都包含兩種內容:儲存為光柵圖像的照片、儲存為向量資料的文字和圖表。了解這種差異可以解釋為什麼有些 PDF 在任何縮放級別下看起來都很清晰,而另一些則變得像素化,為什麼有些文件很大而另一些文件很小,以及為什麼某些內容無法編輯而其他內容可以精確修改。

光柵內容:像素網格
光柵內容由像素組成 - 彩色點的固定網格。嵌入 PDF 中的照片是光柵:每個像素都有特定的顏色值,它們一起形成圖像。柵格內容的關鍵特徵是它具有固定的解析度。在 300 DPI 下,按預期尺寸列印時,光柵影像看起來很清晰。將其放大到 200%,解析度只有一半 — 像素變成可見的正方形,影像看起來模糊。
掃描的 PDF 完全是光柵-每一頁都是一張照片。這就是為什麼 Scanned PDF 檔案很大(大量像素資料)、無法搜尋(沒有文本,只是排列成看起來像字母的彩色點)並且在大幅放大時看起來像素化的原因。您看到的 PDF 品質 直接取決於擷取掃描的 DPI。
嘗試編輯 PDF
無需安裝。直接在您的瀏覽器中工作。
向量內容:數學描述
向量內容是透過數學公式而不是像素來定義的。向量圖形中的線被描述為「起始於座標(10, 20),結束於(150, 20),筆劃寬度2pt,顏色黑色」。 — 不是一排黑色像素。數字 PDF 中的文字是向量:每個字元都是由曲線和座標定義的數學形狀,而不是像素點陣圖。
由於向量內容是透過數學定義的,因此它可以完美地縮放到任何大小。將數字 PDF 中的文字放大到 1000%,它仍然保持完美清晰度 - 渲染器會以新尺寸重新計算曲線。將其列印在廣告看板或名片上,同樣清晰。對於在 Illustrator 等向量工具中建立的標誌、圖表和圖表或從產生向量 PDF 輸出的應用程式匯出的標誌、圖表和圖表也是如此。
典型的PDF如何混合兩種類型
典型的商業 PDF — 報告、簡報、手冊 — 同時包含這兩種類型。文字是向量(任何大小都清晰、存儲緊湊、可搜尋)。在來源應用程式中建立的圖表和圖表可能是向量。從網路複製的照片和影像是光柵。圖標和徽標可能是其中之一,具體取決於它們的創建和嵌入方式。
這就是為什麼放大 PDF 頁面會顯示清晰的文字和清晰的線條藝術,但照片卻模糊 - 文字和圖表是向量,而照片是其嵌入解析度的光柵。這也是為什麼當存在圖像時壓縮 PDF 會顯著減小文件大小,但幾乎不會影響文本較多的 PDF — 您壓縮的是光柵像素數據,而不是向量數學描述。
為什麼這在實務上很重要
- 列印品質:向量內容在任何尺寸下都能清晰列印。只有當其嵌入的解析度足以滿足列印尺寸時,光柵內容才能很好地列印 - 以全頁尺寸列印的 72 DPI 網頁圖像看起來很模糊。
- 檔案大小:向量內容緊湊 - 儲存為向量的複雜圖表可能只有數千位元組。與 300 DPI 下的光柵圖像相同的圖表可能有幾兆位元組。在 PDF 中以向量等效物取代光柵影像可顯著減少檔案大小。
- 可編輯性:可以選擇、複製和編輯 PDF 中的 向量文字(使用正確的工具)。光柵文字只是像素 - 如果沒有 OCR 處理就不可能選擇單字。
- 壓縮行為: PDF 壓縮 主要影響光柵影像。向量內容的壓縮程度最低,因為它在數學上已經是高效率的。在壓縮下不會收縮太多的 PDF 可能主要是向量內容。
如何判斷您正在查看的內容類型
縮放測試是明確的:在任何 PDF 檢視器中,將相關內容放大至 400-500%。如果它保持完全清晰——邊緣清晰,沒有可見的像素化——它就是向量。如果像素變得可見為正方形或圖像變軟和模糊,則它是光柵。
特別是對於文字:如果您可以單擊它並選擇單個單詞,那麼它就是向量文字。如果按一下選擇整個頁面作為圖像區塊,則文字是光柵 - 它僅作為頁面圖像中的像素存在,而不是作為實際文字資料。這與用於確定 PDF 編輯器 是否可以處理內容或是否首先需要 OCR 的測試相同。
嘗試編輯 PDF
無需安裝。直接在您的瀏覽器中工作。
