Menü
c't Magazin

Drei OCR-Programme für Windows im Vergleich

OCR-Programme analysieren Bilddateien auf erkennbare Zeichen und speichern erkannten Text etwa als PDF- oder Office-Dokument. Wir haben drei Programme getestet.

Von
vorlesen Drucken Kommentare lesen 1 Beitrag
Sechs OCR-Programme für Windows im Test

Bevor ein Programm Texte in Bildern interpretieren und verarbeiten kann, muss es die einzelnen Pixelgruppen möglichst fehlerfrei als Buchstaben und Ziffern identifizieren und als Text speichern.

Die optische Zeichenerkennung – auf Englisch: Optical Character Recognition (OCR) – lässt sich für mehrere Zwecke nutzen: In der einfachsten Form liefert sie die Textinhalte aus Scans oder Fotos von Texten. Die Zeichenfolgen des Bildes lassen sich dann am PC durchsuchen, markieren und kopieren.

Die hier vorgestellten OCR-Pakete transformieren Vorlagen auf Wunsch in Office-Dokumente etwa vom Format DOCX, ODT oder durchsuchbares PDF, die der Anwender weiter bearbeiten kann. Dazu bedarf es in vielen Fällen recht ausgefuchster Funktionen, etwa um eine Designer-Schrift aus der Vorlage durch einen ähnlichen Font des Arbeitsplatzrechners zu ersetzen. Und damit ist es noch nicht getan: Während sich der Lesefluss in einem Brief oder einer Buchseite von selbst ergibt, muss ein Programm bei einem mehrspaltigen Text erst einmal herausfinden, in welcher Reihenfolge die Wörter eines Prospekts oder einer Zeitschriftenseite zusammengehören.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

  • Zugriff auf alle Inhalte von heise+
  • exklusive Tests, Ratgeber & Hintergründe: unabhängig, kritisch fundiert
  • c't, iX, Technology Review, Mac & i, Make, c't Fotografie direkt im Browser lesen
  • einmal anmelden – auf allen Geräten lesen - jederzeit kündbar
  • erster Monat gratis, danach monatlich 9,95 €
  • Wöchentlicher Newsletter mit persönlichen Leseempfehlungen des Chefredakteurs
GRATIS-Monat beginnen Jetzt GRATIS-Monat beginnen Mehr Informationen zu heise+
Anzeige