Menü

Finereader CLI OCR 11 für Linux veröffentlicht

Mit Finereader Engine 11 CLI stellt Abbyy die neueste Version seine OCR-Engine auch für Linux bereit. Das Kommandozeilentool ist erstmals als native 64-Bit-Anwendung verfügbar und exportiert jetzt auch in die E-Book-Formate Epub und FB2.

Von
vorlesen Drucken Kommentare lesen 58 Beiträge

Während die Texterkennungssoftware Finereader unter Windows und Mac OS X den vollen Komfort einer grafischen Desktop-Anwendung bietet, gibt es Abbyys OCR-Engine unter Linux nur als Kommandozeilentool. Jetzt hat Abbyy die aktuelle Version seiner OCR-Engine als Finereader Engine 11 CLI für Linux veröffentlicht. Auch ein volles Software Development Kit (SDK) ist verfügbar, das einen noch größeren Funktionsumfang bietet. Als Linux-Zielgruppe hat Abbyy denn auch weniger Desktop-Anwender als Entwickler im Blick, die das Konsolentool in eigene Programme integrieren können.

Finereader Engine 11 CLI liefert Abbyy erstmals als native 64-Bit-Anwendung, sodass auf einem 64-Bit-Linux-System keine 32-Bit-Kompatibilitätsbibliotheken nachgerüstet werden müssen. Finereader Engine**11 CLI unterstützt Multi-Core-Prozessoren und kann beim Erkennen mehrseitiger Dokumente die Last auf mehrere Kerne verteilen.

Bei weiterhin sehr hoher Erkennungsgenauigkeit soll ein neuer Schnelllesemodus mehr Seiten in der gleichen Zeit schaffen. Verarbeitungsprofile fassen passende Einstellungen für häufig benötigte OCR-Szenarien zusammen und lassen sich mit einem eigenen Parameter abrufen.

Beim Export stehen in Finereader Engine 11 CLI die Formate ALTO XML, HTML, XPS, ODT, RTF, TXT und PDF sowie seit neuestem auch die E-Book-Formate Epub und FB2 zur Verfügung. Auch in die neueren Office-Formate DOCX, XLSX und PPTX kann das Programm exportieren, nicht mehr unterstützt werden dagegen DOC und PPT. Noch kleinere PDF-Dateien lassen sich mit dem für die Langzeitarchivierung vorgesehenen Exportformat PDF/A-2 erzeugen.

Als Erkennungssprache ist in dieser Version Arabisch hinzugekommen, die Genauigkeit beim Erkennen chinesischer, japanischer und koreanischer Texte wurde verbessert. Das Erkennen alter Schriften wie Fraktur zählt dagegen nicht mehr zum Standard-Funktionsumfang der OCR-Engine. Mehr über die Neuerungen ist auf der Abbyy-Produktseite nachzulesen.

Der Preis für Abbyy Finereader Engine 11 CLI richtet sich nach der Anzahl der zu verarbeitenden Seiten. Für 149 Euro lassen sich beispielsweise bis zu 12.000 Seiten verarbeiten, soll Finereader auch Arabisch, Chinesisch, Japanisch und Koreanisch erkennen, kostet die Software 223 Euro. Für 999 Euro schafft Finereader bis zu 120.000 Seiten weg (inklusive nicht-europäischer Sprachen 1498 Euro), für 3490 Euro (5235 Euro) sind bis zu 500.000 Seiten pro Jahr enthalten. Auf der Projekt-Website steht eine kostenlose Testversion bereit, mit der sich bis zu 100 Seiten verarbeiten lassen.

Ein Artikel in c't 12/2014 stellt Finereader Engine 11 CLI genauer vor. Das Heft ist ab Montag, 19. Mai im Handel erhältlich. (lmd)