Others

Das Problem mit Screenshot-basierten PDFs

Einen Screenshot zu machen und ihn als PDF zu speichern, klingt nach einer schnellen Möglichkeit, etwas festzuhalten. Für ein einzelnes Bild funktioniert es gut. Als Arbeitsablauf zum Erstellen von Dokumenten – Screenshots von Tabellenkalkulationen, Screenshots von Webseiten, Screenshots anderer PDFs – erzeugt es Dateien mit schwerwiegenden praktischen Einschränkungen, die erst dann offensichtlich werden, wenn Sie versuchen, etwas Nützliches damit zu tun. Hier erfahren Sie, was schief geht und was Sie stattdessen tun können.

The Problem With Screenshot-Based PDFs

Was ein Screenshot-basiertes PDF tatsächlich enthält

Ein aus Screenshots erstelltes PDF ist ein Container, der ein oder mehrere Bilder enthält. Es gibt keine Textebene, keine Dokumentstruktur, keine Metadaten darüber, was der Inhalt bedeutet. Die im Screenshot sichtbaren Wörter existieren nur als Pixel – farbige Punkte, die so angeordnet sind, dass sie wie Buchstaben aussehen. Das Dokument hat nicht mehr semantischen Inhalt als ein Foto einer Seite.

Diese Unterscheidung – echter Text gegenüber Pixeln, die wie Text aussehen – ist die Hauptursache für jedes folgende Problem. Ein PDF-Qualitätsproblem in einem Screenshot PDF ist kein Fehler des PDF-Formats; Es handelt sich um eine grundlegende Einschränkung bei der Verwendung eines Bildformats, wenn ein Dokumentformat benötigt wird.

WukongPDF

Probieren Sie PDF OCR aus

Keine Installation erforderlich. Funktioniert direkt in Ihrem Browser.

Jetzt starten →

Sie können nicht danach suchen

Drücken Sie Strg+F in einem Screenshot PDF und die Suche findet nichts. Der auf der Seite sichtbare Text ist nicht als durchsuchbarer Inhalt vorhanden. Wenn Sie ein PDF eines Forschungsartikels, einer Datentabelle oder eines anderen Dokuments erstellen, auf das Sie später verweisen müssen, stellt die fehlende Möglichkeit, darin zu suchen, eine erhebliche praktische Einschränkung dar.

Die Datei wird auch bei der Suche des Betriebssystems nicht nach Inhalt angezeigt, sondern nur nach Dateiname. Ein Ordner mit Screenshot-PDFs ist nur so navigierbar, wie Ihre Namenskonvention, ohne dass Sie nach Wörtern suchen müssen, an die Sie sich im Dokument erinnern.

Die Qualität lässt nach – und kann nicht wiederhergestellt werden

Ein Screenshot erfasst Inhalte mit Bildschirmauflösung – normalerweise 72 bis 96 DPI auf einem Standardmonitor. PDF-Dokumente, die zum Lesen oder Drucken vorgesehen sind, sollten mindestens 150 DPI haben; Alles, was in hoher Qualität gedruckt werden soll, benötigt 300 DPI. Ein Screenshot-PDF liegt unter dem Mindestschwellenwert für eine zuverlässige Druckqualität, und das Problem verschlimmert sich, wenn das PDF dann komprimiert wird.

Text, der auf dem Bildschirm bei 100 % Zoom akzeptabel aussieht, sieht beim Drucken oder Vergrößern oft merklich verpixelt aus. Zahlen in Tabellen – die besonders wichtig sind, um genau zu lesen – können bei niedriger Auflösung mehrdeutig werden. Eine „6“ und eine „8“ die in der Originalauflösung unterscheidbar sind, sehen möglicherweise in einem komprimierten Screenshot PDF identisch aus.

Sie können keinen Text daraus kopieren

Das Auswählen und Kopieren einer Abbildung, eines Zitats, einer Klausel oder eines anderen Inhalts aus einem Screenshot PDF ist ohne OCR nicht möglich. Der Textcursor wird entweder nicht angezeigt oder wählt das gesamte Bild als Block aus. Jeder, der das Dokument erhält und Inhalte daraus extrahieren muss – ein Zitat in einen Bericht einfügen, eine Zahl in eine Tabellenkalkulation kopieren –, muss manuell erneut tippen.

Bei Dokumenten, die Sie erstellen, damit andere damit arbeiten können – Datentabellen, Referenzdokumente, Forschungszusammenfassungen – verringert diese Einschränkung den Nutzen des Dokuments erheblich. Ein PDF mit echtem Text ist kollaborativ; Ein Screenshot PDF ist im wahrsten Sinne des Wortes schreibgeschützt.

Es erfüllt die Barrierefreiheitsanforderungen nicht

Screenreader – Software, die von Menschen mit Sehbehinderungen verwendet wird – lesen den Textinhalt eines Dokuments. Ein Screenshot PDF hat keinen Textinhalt. Der Bildschirmleser meldet, dass das Dokument geöffnet ist und nichts zum Lesen enthält. In beruflichen oder öffentlichen Kontexten, in denen Dokumente Barrierefreiheitsstandards erfüllen müssen, erfüllt ein Screenshot PDF alle geltenden Anforderungen. Dies ist kein kleines Problem – in vielen Rechtsordnungen stellt die Verbreitung unzugänglicher Dokumente, wenn barrierefreie Alternativen machbar sind, ein Compliance-Problem dar.

Was Sie tun können, anstatt Screenshots zu machen

Der richtige Ansatz hängt davon ab, was Sie erfassen möchten:

  • Erfassen einer Webseite: Verwenden Sie die integrierte Druckfunktion des Browsers > Als PDF-Funktion speichern oder zuerst den Lesemodus verwenden, um eine sauberere Ausgabe zu erhalten. Das Ergebnis enthält echten Text, keine Pixel.
  • Erfassen einer Tabelle: Exportieren Sie direkt aus Excel oder Google Sheets mit Datei > Herunterladen > PDF. Das Ergebnis ist ein ordnungsgemäß formatiertes PDF mit echtem Text in der richtigen Auflösung.
  • Erfassen Sie ein weiteres PDF: Extrahieren Sie die Seiten, die Sie benötigen, mit einem Split-Tool, anstatt sie zu scannen. Die extrahierten Seiten behalten ihre ursprüngliche Auflösung und Textebene.
  • Sie haben bereits Screenshots von PDFs in Ihrem Archiv: führen Sie sie mit dem OCR PDF-Tool von WukongPDF unter www.wukongpdf.com aus, um eine durchsuchbare Textebene hinzuzufügen. Die Auflösung in Druckqualität wird dadurch nicht wiederhergestellt, der Inhalt wird jedoch durchsuchbar und kopierbar.

Screenshots haben ihre Berechtigung – nur nicht als Dokumente

Screenshots sind nützlich, um den visuellen Zustand zu erfassen – wie ein Bildschirm zu einem bestimmten Zeitpunkt aussah, ein UI-Fehler, eine Designreferenz. Sie sind das falsche Werkzeug zum Erstellen von Dokumentdatensätzen, Referenzmaterialien oder allem, was durchsucht, kopiert, in hoher Qualität gedruckt oder von Personen mithilfe unterstützender Technologien abgerufen werden muss. Verwenden Sie für alles in diesen Kategorien die Exportfunktion der Quellanwendung und nicht die Screenshot-Verknüpfung.

WukongPDF

Probieren Sie PDF OCR aus

Keine Installation erforderlich. Funktioniert direkt in Ihrem Browser.

Jetzt starten →