Others

Il problema con PDF basati su screenshot

Fare uno screenshot e salvarlo come PDF sembra un modo rapido per catturare qualcosa. Per una singola immagine funziona bene. Come flusso di lavoro per la creazione di documenti (screenshot di fogli di calcolo, screenshot di pagine Web, screenshot di altri PDF) produce file con gravi limitazioni pratiche che non sono evidenti finché non provi a fare qualcosa di utile con essi. Ecco cosa va storto e cosa fare invece.

The Problem With Screenshot-Based PDFs

Cosa contiene effettivamente un PDF basato su screenshot

Un PDF creato da screenshot è un contenitore che contiene una o più immagini. Non esiste un livello di testo, nessuna struttura del documento, nessun metadato sul significato del contenuto. Le parole visibili nello screenshot esistono solo come pixel: punti colorati disposti in modo da sembrare lettere. Il documento non ha più contenuto semantico di una fotografia di una pagina.

Questa distinzione – testo reale e pixel che sembrano testo – è la causa principale di ogni problema che segue. Un problema di PDF Qualità in uno screenshot PDF non è un errore del formato PDF; è una limitazione fondamentale dell'utilizzo di un formato immagine laddove è necessario un formato documento.

WukongPDF

Prova PDF OCR

Nessuna installazione necessaria. Funziona direttamente nel tuo browser.

Inizia ora →

Non puoi cercarlo

Premi Ctrl+F in uno screenshot PDF e la ricerca non trova nulla. Il testo visibile nella pagina non esiste come contenuto ricercabile. Se stai creando un PDF di un articolo di ricerca, una tabella di dati o qualsiasi documento a cui dovrai fare riferimento in seguito, l'impossibilità di effettuare ricerche al suo interno rappresenta una limitazione pratica significativa.

Inoltre, il file non verrà visualizzato nelle ricerche del sistema operativo in base al contenuto, ma solo in base al nome del file. Una cartella di screenshot PDF è navigabile tanto quanto la tua convenzione di denominazione, senza ricorrere alla ricerca di parole che ricordi di essere nel documento.

La qualità peggiora e non può essere recuperata

Uno screenshot cattura il contenuto alla risoluzione dello schermo, in genere da 72 a 96 DPI su un monitor standard. I documenti PDF destinati alla lettura o alla stampa devono essere di almeno 150 DPI; tutto ciò che verrà stampato ad alta qualità necessita di 300 DPI. Uno screenshot PDF è al di sotto della soglia minima per una qualità di stampa affidabile e il problema si aggrava se PDF viene poi compresso.

Il testo che appare accettabile sullo schermo con uno zoom al 100% spesso appare notevolmente pixelato quando viene stampato o ingrandito. I numeri nelle tabelle, particolarmente importanti da leggere con precisione, possono diventare ambigui a bassa risoluzione. Un "6" e un "8" che sono distinguibili alla risoluzione originale potrebbero sembrare identici in uno screenshot compresso PDF.

Non puoi copiare testo da esso

Selezionare e copiare una figura, una citazione, una clausola o qualsiasi altro contenuto da uno screenshot PDF è impossibile senza OCR. Il cursore del testo non apparirà o selezionerà l'intera immagine come un blocco. Chiunque riceva il documento e abbia bisogno di estrarne qualsiasi contenuto (incollare una citazione in un rapporto, copiare una figura in un foglio di calcolo) deve affrontare la ribattitura manuale.

Per i documenti che stai creando affinché altri possano lavorare (tabelle di dati, documenti di riferimento, riepiloghi di ricerca) questa limitazione riduce significativamente l'utilità del documento. Un PDF con testo reale è collaborativo; uno screenshot PDF è di sola lettura nel senso più letterale.

Non supera i requisiti di accessibilità

I lettori di schermo, software utilizzati da persone con disabilità visive, funzionano leggendo il contenuto testuale di un documento. Uno screenshot PDF non ha contenuto di testo. Lo screen reader annuncia che il documento è aperto e quindi non ha nulla da leggere. In contesti professionali o del settore pubblico in cui i documenti devono soddisfare gli standard di accessibilità, uno screenshot PDF non soddisfa tutti i requisiti applicabili. Questo non è un problema minore: in molte giurisdizioni, la distribuzione di documenti inaccessibili quando sono fattibili alternative accessibili è un problema di conformità.

Cosa fare invece di scattare screenshot

L'approccio giusto dipende da ciò che stai cercando di acquisire:

  • Catturare una pagina web: utilizza la funzione Stampa incorporata nel browser > Salva come funzione PDF o utilizza prima la modalità lettore per un risultato più pulito. Il risultato contiene testo reale, non pixel.
  • Acquisizione di un foglio di calcolo: esporta direttamente da Excel o Fogli Google utilizzando File > Scarica > PDF. Il risultato è un PDF correttamente formattato con testo reale alla risoluzione corretta.
  • Catturare un altro PDF: estrai le pagine che ti servono utilizzando uno strumento di divisione invece di catturarle tramite screenshot. Le pagine estratte mantengono la risoluzione e il livello di testo originali.
  • Hai già screenshot PDF nel tuo archivio: eseguili tramite lo strumento OCR PDF di WukongPDF su www.wukongpdf.com per aggiungere un livello di testo ricercabile. Non ripristinerà la risoluzione della qualità di stampa, ma renderà il contenuto ricercabile e copiabile.

Gli screenshot hanno il loro posto, ma non come documenti

Gli screenshot sono utili per catturare lo stato visivo: come appariva una schermata in un dato momento, un bug dell'interfaccia utente, un riferimento di progettazione. Sono lo strumento sbagliato per creare record di documenti, materiali di riferimento o qualsiasi cosa che debba essere cercata, copiata, stampata con qualità o accessibile da persone che utilizzano tecnologie assistive. Per qualsiasi cosa in queste categorie, utilizza la funzione di esportazione dell'applicazione sorgente anziché il collegamento allo screenshot.

WukongPDF

Prova PDF OCR

Nessuna installazione necessaria. Funziona direttamente nel tuo browser.

Inizia ora →