Menü

Durchsuchbare PDF-Dokumente mit OCRmyPDF erstellen

Das Linux-Tool OCRmyPDF macht aus eingescannten Dokumenten durchsuchbare PDF-Dateien. Bei Bedarf kann es Scans drehen und entzerren oder Bilder optimieren.

Lesezeit: 3 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 4 Beiträge

Gedreht und schief: OCRmyPDF rotiert das Dokument, rückt es gerade und erkennt den Text.

Von

Inhaltsverzeichnis

Briefe, Artikel und andere Schriftstücke lassen sich gut digital archivieren und sichern. Sind sie als durchsuchbare PDF-Dokumente gespeichert, braucht man auch kein Dokumenten-Management, um etwas wiederzufinden: Eine einfache Desktop-Suche stöbert ein Schreiben vermutlich schneller auf, als Sie einen Ordner aus dem Regal ziehen und durchblättern können.

Das kostenlose Kommandozeilentool OCRmyPDF versieht einfache PDF-Dokumente mit einer unsichtbaren, durchsuchbaren Textebene und legt sie im Format PDF/A ab, das für die Langzeitarchivierung elektronischer Dokumente gedacht ist und sich auch in vielen Jahren noch öffnen lassen soll.

Dabei platziert OCRmyPDF die Textebene recht präzise im Dokument, sodass Sie Textabschnitte mit der Maus markieren und per Copy & Paste weiterverwenden können. Ganz exakt liegen die Buchstaben dabei nicht auf dem Original, unter anderem wegen fehlender Schriftarten.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

  • Zugriff auf alle Inhalte von heise+
  • exklusive Tests, Ratgeber & Hintergründe: unabhängig, kritisch fundiert
  • c't, iX, Technology Review, Mac & i, Make, c't Fotografie direkt im Browser lesen
  • einmal anmelden – auf allen Geräten lesen - jederzeit kündbar
  • erster Monat gratis, danach monatlich 9,95 €
  • Wöchentlicher Newsletter mit persönlichen Leseempfehlungen des Chefredakteurs
GRATIS-Monat beginnen Jetzt GRATIS-Monat beginnen Mehr Informationen zu heise+