Tips & Tricks

So kopieren Sie eine Tabelle aus einem PDF nach Excel

Ein PDF mit einer Datentabelle lässt sich scheinbar leicht in Excel kopieren – bis Sie es versuchen und feststellen, dass die Daten als ein Durcheinander in einer einzelnen Spalte oder mit Zeilenumbrüchen an den falschen Stellen oder zusammengeführten Zellen, die nicht der ursprünglichen Tabellenstruktur entsprechen, herauskommen. Um Tabellendaten sauber von PDF nach Excel zu übertragen, müssen Sie wissen, welche Methode für Ihren spezifischen PDF-Typ funktioniert.

How to Copy a Table From a PDF to Excel

Warum Copy-Paste normalerweise zu unschönen Ergebnissen führt

PDF speichert Tabelleninhalte als positionierten Text – einzelne Textelemente, die an bestimmten Koordinaten auf der Seite platziert sind, und nicht als strukturierte Tabellendaten mit Zeilen und Spalten. Wenn Sie aus einem PDF kopieren und einfügen, kopieren Sie Text in der Reihenfolge, in der er in der internen Struktur der Datei erscheint, was möglicherweise nicht mit der visuellen Lesereihenfolge übereinstimmt. Eine dreispaltige Tabelle mit zehn Zeilen könnte als dreißig Textzeilen ohne Spaltentrennung eingefügt werden.

Einige PDF-Viewer handhaben die Tabellenerkennung beim Einfügen besser als andere. Die Kopie des Adobe Acrobat Reader liefert tendenziell bessere Ergebnisse als browserbasierte Viewer. Bei komplexen Tabellen ist das Kopieren und Einfügen jedoch selten sauber genug, um ohne erhebliche manuelle Bereinigung verwendet zu werden.

WukongPDF

Probieren Sie PDF to Excel aus

Keine Installation erforderlich. Funktioniert direkt in Ihrem Browser.

Jetzt starten →

Die beste Methode: PDF direkt in Excel konvertieren

Ein spezieller PDF-zu-Excel-Konverter analysiert das Layout des PDF, identifiziert Tabellenstrukturen und ordnet den Inhalt den Tabellenzellen zu. Das Ergebnis ist eine Excel-Datei, in der Tabellenzeilen und -spalten dem ursprünglichen PDF-Layout entsprechen – viel sauberer als durch Kopieren und Einfügen.

Das PDF to Excel-Tool von WukongPDF unter www.wukongpdf.com erledigt dies: PDF hochladen, Excel-Datei herunterladen. Bei digitalen PDFs mit klarer Tabellenstruktur ist die Konvertierung in der Regel sauber genug, um mit minimaler Korrektur verwendet zu werden. Bei komplexen Tabellen mit zusammengeführten Zellen, verschachtelten Überschriften oder unregelmäßiger Struktur ist immer noch eine gewisse manuelle Bereinigung erforderlich – jedoch weitaus weniger als beim Kopieren und Einfügen.

Gescannte PDFs: Zuerst OCR, dann konvertieren

Wenn das PDF, das die Tabelle enthält, ein Scan ist – ein Bild einer Seite und kein digitales Dokument – ​​funktioniert das Kopieren und Einfügen überhaupt nicht (es gibt keinen zu kopierenden Text) und die direkte Konvertierung führt zu schlechten Ergebnissen. Gescannte Tabellen benötigen zunächst eine OCR-Verarbeitung, um echten Text zu extrahieren, und dann muss der Text als Tabellenstruktur interpretiert werden.

Einige PDF-zu-Excel-Konverter wenden OCR automatisch an, wenn sie ein gescanntes Dokument erkennen. Bei anderen müssen Sie zuerst OCR ausführen und dann konvertieren. Überprüfen Sie die Qualität des Scans, bevor Sie mit der Konvertierung beginnen – Tabellen mit klaren Zeilen- und Spaltengrenzen lassen sich besser konvertieren als solche mit schwachen Linien oder unregelmäßigen Abständen.

Adobe Acrobat Pro: Export nach Excel

Adobe Acrobat Pro verfügt über eine integrierte Funktion zum Exportieren nach Excel (Datei > Exportieren in > Tabellenkalkulation > Microsoft Excel-Arbeitsmappe). Dies ist eines der genauesten Tabellenextraktionstools auf dem Markt – der Tabellenerkennungsalgorithmus von Acrobat ist ausgereift und verarbeitet eine Vielzahl von Tabellentypen.

Durch den Export wird eine Excel-Datei erstellt, in der jede Tabelle auf jeder Seite in einem separaten Arbeitsblatt oder Abschnitt platziert wird. Komplexe mehrseitige Tabellen, Tabellen mit sich wiederholenden Überschriften und Tabellen mit verbundenen Zellen werden alle einigermaßen gut gehandhabt. Wenn Sie über Acrobat Pro verfügen, ist dies die qualitativ hochwertigste Option zur Tabellenextraktion.

Wenn Kopieren und Einfügen die einzige Option ist – So bereinigen Sie es

Wenn kein Konvertierungstool verfügbar ist und Sie Kopieren und Einfügen verwenden müssen, minimieren diese Schritte den Bereinigungsaufwand:

  • Wählen Sie im Adobe Reader den Tabellentext aus und verwenden Sie Bearbeiten > Kopieren mit Formatierung, falls verfügbar – dadurch bleibt mehr von der Tabellenstruktur erhalten als beim einfachen Kopieren
  • Fügen Sie es zuerst in einen Texteditor (Notepad, TextEdit) ein, nicht direkt in Excel – so können Sie die Rohstruktur sehen, ohne dass die Zellformatierung von Excel die Sache verkompliziert
  • Kopieren Sie den Text aus dem Texteditor und fügen Sie ihn mit „Inhalte einfügen“ > in Excel ein. Text
  • Verwenden Sie die Excel-Funktion „Text in Spalten“ (Daten > Text in Spalten), um die eingefügten Daten basierend auf einem Trennzeichen oder festen Breiten in separate Spalten aufzuteilen

Wenn kein Werkzeug ein sauberes Ergebnis liefert

Einige Tabellen sind für automatisierte Tools wirklich schwierig – verschachtelte Tabellen in Tabellen, Tabellen mit komplexen Mustern zusammengeführter Zellen, Tabellen, die sich über mehrere Seiten mit sich wiederholenden Überschriften erstrecken, oder Tabellen, in denen Daten visuell strukturiert sind, ohne dass formale Tabellenmarkierungen im PDF vorliegen. Für diese wäre die manuelle Dateneingabe unter Verwendung von PDF als Referenz möglicherweise der praktischste Ansatz. Bei kleinen Tabellen nimmt dies weniger Zeit in Anspruch, als zu versuchen, ein automatisiertes Tool dazu zu zwingen, ein sauberes Ergebnis zu liefern und dann alle Fehler manuell zu beheben.

WukongPDF

Probieren Sie PDF to Excel aus

Keine Installation erforderlich. Funktioniert direkt in Ihrem Browser.

Jetzt starten →