Flinke Texterkennung

Test & Kaufberatung | Kurztest

OCRmyPDF unterzieht Dokumente einer Texterkennung und generiert aus Text und Bild eine durchsuchbare PDF-Datei.

Archiviert man Scans als durchsuchbare PDF-Dateien, findet man ein gesuchtes Dokument schneller wieder. Liegen die Scans nur als PDF-Dateien mit eingebetteten Bitmaps vor, fügt unter Linux das Kommandozeilenprogramm OCRmyPDF diesen schnell eine unsichtbare Textebene hinzu. Dabei glänzt es vor allem in einem Punkt, an dem viele vergleichbare Linux-Programme patzen (siehe c’t 22/2013): der genauen Positionierung des erkannten Textes, ohne die sich Textabschnitte schlecht per Copy & Paste übernehmen lassen. ...

Sie möchten wissen, wie es weitergeht?

Als c't-Plus-Abonnent gratis lesen

Anmelden als c't-Plus-Abonnent