Others

Cosa succede a un PDF quando lo comprimi?

La compressione di un PDF lo rende più piccolo, ma "più piccolo" copre una serie di cose che accadono sotto il cofano. Ciò che viene effettivamente modificato dipende da cosa contiene il file e dal tipo di compressione applicata. Comprenderlo ti aiuta a prevedere come sarà l'output e spiega perché la stessa impostazione di compressione produce risultati notevolmente diversi su documenti diversi.

What Happens to a PDF When You Compress It?

A PDF è composto da diversi tipi di dati in un unico file

Prima di approfondire cosa fa la compressione, è utile sapere cosa c'è dentro un PDF. Un tipico documento contiene una combinazione di: grafica vettoriale (forme, linee, grafici disegnati matematicamente), immagini raster (fotografie, pagine scansionate, schermate), testo con dati sui caratteri, metadati del documento (autore, data di creazione, titolo) e informazioni strutturali (layout di pagina, segnalibri, collegamenti). Ognuno di questi viene memorizzato in modo diverso e risponde alla compressione in modo diverso.

WukongPDF

Prova a comprimere PDF

Nessuna installazione necessaria. Funziona direttamente nel tuo browser.

Inizia ora →

Cosa succede alle immagini

Le immagini sono il luogo in cui risiede la maggior parte delle dimensioni del file di PDF e dove la compressione ha l'effetto più drammatico. Quando comprimi un PDF, lo strumento ricodifica le immagini incorporate utilizzando un algoritmo di compressione più aggressivo, in genere JPEG per immagini a colori, JBIG2 o CCITT per quelle in bianco e nero. Ciò riduce la quantità di dati archiviati per rappresentare ciascuna immagine.

La compressione JPEG è con perdita di dati: elimina in modo permanente alcuni dati dell'immagine per ottenere file di dimensioni inferiori. Con impostazioni di alta qualità (80-90%), i dati scartati si trovano nelle aree dell'immagine dove l'occhio umano è meno sensibile: struttura fine, sfumature di colore sottili, dettagli ad alta frequenza. Il risultato sembra essenzialmente identico. Con impostazioni di qualità inferiori, i dati scartati diventano visibili come blocchi, sfocature o bande di colore: i classici artefatti JPEG.

Il downsampling è un passaggio correlato applicato da alcuni strumenti di compressione. Riduce le dimensioni in pixel delle immagini (un'immagine da 300 DPI potrebbe diventare 150 DPI) il che rende i file molto più piccoli ma rende anche le immagini più morbide se stampate o ingrandite. Gli strumenti di qualità PDF Compressione saltano il downsampling o lo rendono un'impostazione facoltativa.

Cosa succede al testo

Il testo in un PDF viene archiviato come caratteri con posizioni, stili e riferimenti ai caratteri, non come immagini di lettere. Questi dati vengono compressi in modo molto efficiente utilizzando algoritmi senza perdita di dati come Deflate (lo stesso algoritmo utilizzato nei file ZIP). La compressione senza perdita di dati riduce le dimensioni del file senza rimuovere alcun dato: l'output decompresso è identico bit per bit all'originale.

Ciò significa che il testo in un PDF compresso è esattamente lo stesso dell'originale: stessi caratteri, stesse posizioni, stessa resa dei caratteri. Il testo di un documento compresso non viene degradato in alcun modo. Se il testo in un PDF compresso ha un aspetto diverso, il problema è il rendering dei caratteri nel visualizzatore, non qualcosa che è cambiato a causa della compressione.

Cosa succede ai caratteri

I caratteri incorporati possono contribuire in modo significativo alla dimensione del file. Un PDF che incorpora file di font completi per cinque caratteri tipografici potrebbe contenere diversi megabyte di dati sui soli font. Gli strumenti di compressione possono risolvere questo problema attraverso il sottoinsieme dei caratteri, rimuovendo dal carattere incorporato tutti i caratteri che non sono effettivamente utilizzati nel documento. Un documento che utilizza solo le lettere A-Z e 0-9 non necessita dell'intero set di caratteri Unicode incorporato.

Il sottoinsieme dei caratteri è senza perdite dal punto di vista del lettore: il documento viene comunque visualizzato correttamente perché tutti i caratteri che compaiono in esso sono ancora presenti. Il risparmio dipende dal numero di caratteri incorporati nel carattere originale rispetto a quanti vengono effettivamente utilizzati.

Cosa viene rimosso completamente

Oltre a comprimere i dati esistenti, gli strumenti di compressione rimuovono anche il sovraccarico che si accumula nei PDF nel tempo. Ogni volta che un PDF viene modificato e salvato, la versione precedente degli elementi modificati viene spesso mantenuta nella struttura del file anziché eliminata: ecco come funzionano la cronologia di annullamento e il ripristino della versione all'interno degli editor PDF. Un documento che ha attraversato molti cicli di modifica-salvataggio può portare un sacco di peso morto: vecchie versioni di oggetti, dati duplicati, contenuto cancellato che non è mai stato effettivamente rimosso dal file.

La compressione lo pulisce. Lo strumento ricostruisce la struttura del file da zero, mantenendo solo lo stato corrente di ciascun elemento e scartando la cronologia accumulata. Questo è il motivo per cui i PDF appena compressi a volte sono notevolmente più piccoli del previsto: il file conteneva un notevole volume nascosto dalle modifiche precedenti.

Cosa rimane esattamente lo stesso

La compressione non modifica il contenuto, il layout o la struttura del documento. Il conteggio delle pagine, l'ordine delle pagine, il contenuto del testo, la grafica vettoriale, i segnalibri, i collegamenti ipertestuali e i campi del modulo rimangono tutti intatti. Il PDF compresso si apre, viene visualizzato e si comporta in modo identico all'originale per tutti gli scopi pratici.

Ciò che potrebbe cambiare, a seconda delle impostazioni, è la nitidezza dell'immagine a livelli di zoom elevati e i metadati del file. Alcuni strumenti di compressione rimuovono o aggiornano i metadati, il che di solito va bene, ma vale la pena sapere se la data di creazione originale o il campo dell'autore sono importanti per i tuoi record.

WukongPDF

Prova a comprimere PDF

Nessuna installazione necessaria. Funziona direttamente nel tuo browser.

Inizia ora →