CODEDOCU.de

PDF Text nicht markierbar: woran es liegt und was du tun kannst

Lesedauer: ca. 3 Minuten

Du öffnest ein PDF, willst schnell eine Zeile markieren oder Text kopieren, aber es klappt nicht. Stattdessen lässt sich nur ein großer Auswahlrahmen ziehen oder gar nichts. Das wirkt wie eine Sperre, ist aber in den meisten Fällen ganz banal: Das PDF enthält keinen echten Text, sondern nur ein Bild von Text.

Der häufigste Grund: Das PDF ist ein Scan

Viele PDFs entstehen aus einem Scanner oder aus einer Handy-Kamera. Jede Seite wird dabei als Bild gespeichert. Für das PDF sieht das wie Text aus, technisch ist es aber nur ein Foto. Bildinhalt lässt sich nicht markieren, nicht durchsuchen und nicht kopieren.

Ein schneller Test: Zoome stark hinein. Wenn die Buchstaben pixelig wirken, ist es sehr wahrscheinlich ein Scan. Auch die Suchfunktion ist ein guter Hinweis. Findet die Suche nichts, obwohl das Wort sichtbar ist, fehlt echter Text.

Zweiter Grund: Text ist als Grafik eingebettet

Auch ohne Scanner kann Text als Grafik im PDF landen. Das passiert bei alten Druckertreibern, Formularen oder schlecht exportierten Dateien. Optisch sieht alles korrekt aus, aber die Textstruktur ist verloren.

Dritter Grund: Kopieren ist eingeschränkt

Manche PDFs haben Einschränkungen für Markieren oder Kopieren. Das ist aber seltener als vermutet. In der Praxis steckt fast immer ein Scan oder eine Grafik dahinter und keine echte Zugriffsbeschränkung.

Die Lösung: OCR

Wenn das PDF ein Scan ist, hilft OCR. Dabei wird das Bild analysiert und in echten Text umgewandelt. Danach lassen sich Textstellen markieren, kopieren und durchsuchen.

OCR ist nicht perfekt. Schlechte Scans, schiefe Seiten oder niedriger Kontrast führen zu Fehlern. Trotzdem ist OCR fast immer der beste Weg, um ein nicht markierbares PDF wieder nutzbar zu machen.

Was du vor OCR prüfen solltest

  • Ist das gesamte PDF ein Scan oder nur einzelne Seiten?
  • Sind manche Bereiche markierbar und andere nicht?
  • Wie gut ist die Scan-Qualität?
  • Gibt es Hinweise auf Dokumentenschutz?

Wenn nur einzelne Bereiche nicht markierbar sind

Viele PDFs sind gemischt aufgebaut. Fließtext ist echter Text, Unterschriften oder Stempel sind Bilder. Dann kannst du Text markieren, aber nicht die grafischen Elemente. Das ist normal und kein Fehler.

Zusammenfassung

Wenn Text im PDF nicht markierbar ist, existiert er technisch meist nicht als Text. Bei Scans hilft OCR, bei eingebetteten Grafiken muss das Dokument neu erzeugt werden. Erst klären, was man vor sich hat, dann ist die Lösung schnell gefunden.

Status: bereit Tutorial: PDF System: ok