Xerox-Software verändert eingescannte Zahlen

Bild: David Kriesel

Im Zusammenhang mit der mehrheitlichen Übernahme des Druckerherstellers Xerox durch Fujifilm ist der 2013 entdeckte Software-Bug wieder aufgepoppt - Ob dieser Fehler bei allen betroffenen Geräten inzwischen beseitigt ist, ist nicht bekannt

2013 hatte der Informatiker David Kriesel in Scans, die mit damals schon seit acht Jahren im Markt befindlichen Xerox-Multifunktionskopierern (Xerox Workcenter) angefertigt wurden, festgestellt, dass bestimmte Zeichen in den Scans durch andere, ähnlich aussehende, ersetzt worden waren (Character Substition). Dies fiel zuerst bei Quadratmeterangaben eines Bauplans auf, wo die Zahlen-Angaben im Scan nicht mit den eingezeichneten Größenverhältnissen der Räume korrelierten. Es gab ebenso Fälle, bei welchen in einer Spalte hierarchisch aufsteigend angeordnete Zahlenangaben unvermittelt aus der Serie ausbrachen. Statt der im Original vorhandenen "6" stand im Scan dann eine "8".

Da die einzelnen Ziffern selbst völlig fehlerfrei aussahen, war der Fehler auf Anhieb nicht zu erkennen und war offensichtlich auch über acht Jahre, in welchen die Gerätefamilie schon im Einsatz war, bei den Anwendern nicht aufgefallen. Bei Xerox war das Problem jedoch offensichtlich bekannt, denn im Adminpanel der Kopierer gab es eine kleine Meldung zu Character Substition und dass der Fehler mit den falschen Zeichen weg sei, wenn man die Kompression von "normal" auf "higher" umstellt.

Leider wird der Nutzer nur beim Setzen der Kompressionseinstellung auf das Problem hingewiesen. Wer sich nicht mit der Kompressionseinstellung beschäftigt, wird im Zweifelsfalle unwissentlich falsche Dokumente produzieren. Welche Einstellung bei der Lieferung der Geräte eingestellt ist, ist nicht nachvollziehbar, da Xerox die Geräte nicht selbst an die Nutzer liefert, sondern dafür lokale Vertriebspartner nutzt. Daher konnte Xerox auch die Nutzer seiner betroffenen Geräte nicht anschreiben und über das Risiko der vertauschten Zeichen informieren. Da beim sogenannten ersetzenden Scannen die analogen Originale nach dem Einscannen vernichtet werden, sind die Fehler, die beim Scannen entstehen, heute praktisch nicht mehr zu korrigieren.

Zurückzuführen war diese Verfälschung letztlich auf den in den Xerox-Geräten eingesetzten Kompressionsalgorithmus JBIG2. Dabei werden gleiche Zeichen nur einmal abgespeichert. Zudem wird die Positionen gespeichert, an welchen dieses Zeichen einzusetzen ist. Dummerweise sind die Fehler nicht nur bei den verlustbehafteten Kompressionmodi, sondern zumindest bei einem Xerox WorkCentre 7545 in allen drei auswählbaren Modi (einschließlich der Werkseinstellung) aufgetreten. Xerox hat inzwischen einen Patch ausgeliefert, der die JBIG2-Kompression und das dort implementierte Pattern Matching deaktiviert. Auf wie vielen der mehreren hunderttausenden betroffenen Workcenter dieser Patch inzwischen aufgespielt wurde, ist nicht bekannt.

Obwohl die Fehlerursache für die bei Xerox aufgetretenen Verfälschungen offensichtlich nicht in JBIG2 lag, sondern in der fehlerhaften Parametrierung beim Kodieren in JBIG2, hat das Bundesamt für Sicherheit in der Informationstechnik (BSI) jetzt festgelegt, dass die Nutzung aller Verfahren, die zur Bildkompression "Pattern Matching & Substitution" nutzen, nicht eingesetzt werden dürfen. Auch das damit verwandte "Soft Pattern Matching" darf nicht eingesetzt werden. Es dürfen somit sowohl die verlustfreie, als auch die verlustbehaftete Variante des verbreiteten JBIG2-Formats nicht mehr genutzt werden. Dadurch sind letztlich auch alle anderen Anbieter, welche die JBIG2 fehlerfrei implementiert hatten, vom Xerox-Fehler betroffen.

Die Krux bei JBIG2 besteht wohl in erster Linie darin, dass es sich bei JBIG2 nicht um einen Kompressionsstandard, sondern um einen Dekompressionsstandard handelt und jeder Anbieter für die Kompression sein eigenes Verfahren einsetzen kann, das dieses möglicherweise fehlerbehaftet ist. Dieses wäre dann im konkreten Fall nur durch einen direkten Vergleich mit der eingescannten Vorlage zu erkennen.

Während es im Zusammenhang mit Fragen der elektrischen Sicherheit von Geräten Datenbanken wie Rapex gibt, wo sich jeder über konkrete Sicherheitsprobleme informieren kann, sind vergleichbare Informationsmöglichkeiten im Bereich des rechtssicheren Transfers von analogen Informationen in digitale Medien bislang nicht bekannt. Und so muss ein Anwender damit rechnen, dass seine vor dem Bekanntwerden des Scanfehlers bei Xerox eingescannten Dokumente möglicherweise vor Gericht keinen Bestand haben. Ein Rückgriff auf die Originalvorlagen ist in vielen Fällen heute nicht mehr möglich. (Christoph Jehle)

Anzeige