Others

Het probleem met op screenshots gebaseerde PDFs

Een screenshot maken en deze opslaan als PDF klinkt als een snelle manier om iets vast te leggen. Voor een enkele afbeelding werkt het prima. Als workflow voor het maken van documenten (screenshots van spreadsheets, screenshots van webpagina's, screenshots van andere PDFs) produceert het bestanden met ernstige praktische beperkingen die pas duidelijk worden als je er iets nuttigs mee probeert te doen. Hier leest u wat er misgaat en wat u in plaats daarvan kunt doen.

The Problem With Screenshot-Based PDFs

Wat een op screenshots gebaseerde PDF eigenlijk bevat

Een PDF gemaakt van screenshots is een container met een of meer afbeeldingen. Er is geen tekstlaag, geen documentstructuur, geen metadata over wat de inhoud betekent. De woorden die in de schermafbeelding zichtbaar zijn, bestaan ​​alleen als pixels: gekleurde stippen die zo zijn gerangschikt dat ze op letters lijken. Het document heeft niet meer semantische inhoud dan een foto van een pagina.

Dit onderscheid – echte tekst versus pixels die op tekst lijken – is de hoofdoorzaak van elk probleem dat volgt. Een PDF kwaliteitsprobleem in een screenshot PDF is geen fout in het PDF-formaat; het is een fundamentele beperking van het gebruik van een afbeeldingsformaat waar een documentformaat nodig is.

WukongPDF

Probeer PDF OCR

Geen installatie nodig. Werkt rechtstreeks in uw browser.

Nu beginnen →

Je kunt er niet naar zoeken

Druk op Ctrl+F in een screenshot PDF en de zoekopdracht vindt niets. De tekst die op de pagina zichtbaar is, bestaat niet als doorzoekbare inhoud. Als u een PDF maakt van een onderzoeksartikel, een gegevenstabel of een ander document waarnaar u later moet verwijzen, is het onvermogen om daarin te zoeken een aanzienlijke praktische beperking.

Het bestand wordt ook niet weergegeven bij zoekopdrachten van het besturingssysteem op inhoud, alleen op bestandsnaam. Een map met screenshot PDFs is slechts zo navigeerbaar als uw naamgevingsconventie, zonder dat u hoeft te zoeken naar woorden waarvan u zich herinnert dat ze in het document stonden.

De kwaliteit gaat achteruit en kan niet worden hersteld

Een screenshot legt inhoud vast met een schermresolutie – doorgaans 72 tot 96 DPI op een standaardmonitor. PDF documenten die bedoeld zijn om te lezen of af te drukken moeten minimaal 150 DPI zijn; alles wat met hoge kwaliteit wordt afgedrukt, heeft 300 DPI nodig. Een screenshot PDF ligt onder de minimumdrempel voor een betrouwbare afdrukkwaliteit, en het probleem wordt groter als de PDF vervolgens wordt gecomprimeerd.

Tekst die er op het scherm bij 100% zoom acceptabel uitziet, ziet er vaak merkbaar korrelig uit wanneer deze wordt afgedrukt of ingezoomd. Getallen in tabellen – vooral belangrijk om nauwkeurig te lezen – kunnen bij een lage resolutie dubbelzinnig worden. Een "6" en een "8" die bij de oorspronkelijke resolutie te onderscheiden zijn, kunnen er identiek uitzien in een gecomprimeerde schermafbeelding PDF.

Je kunt er geen tekst uit kopiëren

Het selecteren en kopiëren van een figuur, een citaat, een clausule of enige andere inhoud van een screenshot PDF is onmogelijk zonder OCR. De tekstcursor verschijnt niet of selecteert de hele afbeelding als een blok. Iedereen die het document ontvangt en er inhoud uit moet halen (een citaat in een rapport plakken, een figuur naar een spreadsheet kopiëren) wordt geconfronteerd met handmatig overtypen.

Voor documenten die u maakt zodat anderen ermee kunnen werken (gegevenstabellen, referentiedocumenten, onderzoekssamenvattingen) vermindert deze beperking de bruikbaarheid van het document aanzienlijk. Een PDF met echte tekst is een samenwerking; een screenshot PDF is alleen-lezen in de meest letterlijke zin.

Het voldoet niet aan de toegankelijkheidsvereisten

Schermlezers – software die wordt gebruikt door mensen met een visuele beperking – werken door de tekstinhoud van een document te lezen. Een screenshot PDF heeft geen tekstinhoud. De schermlezer kondigt aan dat het document geopend is en vervolgens niets meer te lezen heeft. In professionele contexten of contexten in de publieke sector waar documenten moeten voldoen aan de toegankelijkheidsnormen, voldoet een screenshot PDF niet aan alle toepasselijke vereisten. Dit is geen klein probleem; in veel rechtsgebieden is het verspreiden van ontoegankelijke documenten wanneer toegankelijke alternatieven mogelijk zijn een complianceprobleem.

Wat te doen in plaats van screenshots te maken

De juiste aanpak hangt af van wat u probeert vast te leggen:

  • Een webpagina vastleggen: gebruik de ingebouwde browser Afdrukken > Opslaan als PDF-functie, of gebruik eerst de leesmodus voor een schonere uitvoer. Het resultaat bevat echte tekst, geen pixels.
  • Een spreadsheet vastleggen: exporteer rechtstreeks vanuit Excel of Google Spreadsheets met behulp van Bestand > Downloaden > PDF. Het resultaat is een correct opgemaakte PDF met echte tekst in de juiste resolutie.
  • Een andere PDF vastleggen: extraheer de pagina's die u nodig hebt met behulp van een splitstool in plaats van er een screenshot van te maken. De geëxtraheerde pagina's behouden hun oorspronkelijke resolutie en tekstlaag.
  • Heb al screenshots van PDFs in je archief: voer ze uit via de tool OCR PDF van WukongPDF op www.wukongpdf.com om een ​​doorzoekbare tekstlaag toe te voegen. De resolutie van de afdrukkwaliteit wordt niet hersteld, maar het maakt de inhoud doorzoekbaar en kopieerbaar.

Schermafbeeldingen hebben hun plaats – alleen niet als documenten

Schermafbeeldingen zijn handig voor het vastleggen van de visuele status: hoe een scherm er op een bepaald moment uitzag, een UI-bug, een ontwerpreferentie. Ze zijn het verkeerde hulpmiddel voor het maken van documentrecords, referentiemateriaal of iets anders dat moet worden doorzocht, gekopieerd, op kwaliteit afgedrukt of toegankelijk is voor mensen die ondersteunende technologie gebruiken. Voor alles in deze categorieën gebruikt u de exportfunctie van de brontoepassing in plaats van de screenshot-snelkoppeling.

WukongPDF

Probeer PDF OCR

Geen installatie nodig. Werkt rechtstreeks in uw browser.

Nu beginnen →