c't 7/2019
S. 146
Praxis
OCR mit Python
Aufmacherbild
Bild: Albert Hulm

Lese-Schlange

Texterkennung mit Tesseract und Python

Die Python-Bibliothek pytesseract erkennt Text in Grafiken und liest diesen aus. Wir haben ein Programm geschrieben, das aus einer PDF-Datei den Essensplan der Kantine liest.

Mit OCR (Optical character recognition) können Programme Text aus Bildern lesen und dann als Zeichenkette weiterverarbeiten. Das ist beispielsweise nützlich, um gescannte Briefe maschinell zu durchsuchen oder in Bildern Kennzeichen zu erkennen. Unter der Haube von modernen OCR-Engines steckt meist künstliche Intelligenz. Die hat an tausenden von Beispielen gelernt, wie Zeichen und Schriften aussehen und welchen Text sie darstellen.

In diesem Beispiel soll die OCR-Bibliothek tesseract von Google den Speiseplan der Heise-Kantine im PDF-Format in Python auslesen und das Angebot des Tages bereitstellen.

Kommentare lesen (2 Beiträge)

Weitere Bilder

Lese-Schlange (2 Bilder)

Mit den Prozentzahlen kann das Programm den Speiseplan unabhängig vom Papierformat einlesen.