Menü

Die Zukunft der Archive: Die hohen Hürden bei der Datenarchivierung

Eine ansteigende Flut digitaler Kulturgüter fordert Archive, Bibliotheken und Museen heraus. Was wird getan, um dieses kulturelle Erbe zu bewahren?

vorlesen Drucken Kommentare lesen 157 Beiträge

Keilschrifttafel aus Persepolis

(Bild: Nickmard Khoey, Persepolis, CC BY-SA 2.0 )

Inhaltsverzeichnis

Wer kennt das nicht: Nach einem Systemupdate verweigern Anwendungen den Dienst, in veralteten Formaten gespeicherte Daten lassen sich nicht mehr öffnen, Datenträger sind beschädigt oder es fehlt das passende Lesegerät. Geläufig ist auch die Erfahrung, dass digitale Medien die Erinnerungskultur verändern: Vergangene Ereignisse sind in Chatverläufen, Timelines und Online-Fotoarchiven anders präsent als in klassischen Briefwechseln und Fotoalben. Auch hier droht Datenverlust: Dienste in der Cloud können etwa ihr Geschäftsmodell ändern oder gar den Betrieb einstellen.

Lesen Sie in der Reihe "Die Zukunft der Archive" auch:

mehr anzeigen

Die Sorge um Datenverlust und der Wunsch, zukunftsfähige Nutzungsmöglichkeiten von Daten und Anwendungen zu entwerfen, treiben auch Archivare, Museumskuratoren und nichtinstitutionelle Aktivisten um. Ende November haben sie sich an der Deutschen Nationalbibliothek in Frankfurt am Main auf einer Konferenz versammelt, um über die "Bewahrung des digitalen kulturellen Erbes" zu diskutieren. Diese Konferenz ist Ausgangspunkt der vorliegenden dreiteiligen Serie.

Gut 30.000 Jahre alt: Die Venus von Willendorf

(Bild: Matthias Kabel, CC BY-SA 3.0 )

Archäologische Funde wie die Venus von Willendorf, Höhlenbilder oder sumerische Keilschrifttafeln bieten auch nach Tausenden von Jahren die Möglichkeit zur Untersuchung vergangener Kulturen. Wesentliche Teile der heutigen Kultur sind jedoch nicht in Stein gemeißelt oder in Ton geprägt. Sie manifestieren sich im zunehmend komplexen, im steten Wandel begriffenen Zusammenspiel von digitaler Hard- und Software, von Datenströmen, Dateiformaten und Netzwerkprotokollen. Was davon wird bleiben und zukünftigen Forschergenerationen die Möglichkeit zur Interpretation bieten? Welche Anstrengungen unternehmen die Kulturbewahrer zur Erhaltung, wo besteht Handlungsbedarf?

Wer diese Fragen angeht, sieht sich mit einer kaum überschaubaren Vielfalt an digitalen Kulturgütern und einer Gemengelage aus konzeptionellen, technischen und nicht zuletzt urheberrechtlichen Fragen konfrontiert. Aktivisten wie der Gründer des Internet Archive, Brewster Kahle, oder Stefano Zacchiroli von Software Heritage lassen sich nicht bange machen, ihr etwas hemdsärmelig anmutender Optimismus scheint notwendig: Kahle strebt an, "das gesamte Wissen der Menschheit" frei verfügbar bereitzustellen, und Zacchiroli verfolgt das Ziel, "allen Quellcode, der jemals geschrieben wurde zu sammeln, zu konservieren und zu teilen".

Ein grundlegendes Merkmal digitaler Archivalien betrifft die Frage, ob diese ursprünglich in analoger Form vorgelegen haben. Das können etwa Digitalisate von historischen Handwerkzeugen und Skulpturen, gedruckten Büchern, Ölgemälden und Bleistiftzeichnungen, 35mm-Filmen, Tonbändern und Schallplatten sein. Man spricht hier auch von Retrodigitalisierung. Inhalte, die, wie Computerspiele, CAD-Daten, Datenbanken und Instagram-Stories, von vornherein digital sind, bezeichnet man als "born digital".

Speichern ist nicht gleich Archivieren, die Arbeit des Archivars beschränkt sich nicht auf das bloße Befüllen seiner Bestände. Die Konzeption und Bereitstellung von Zugriffsmöglichkeiten und Werkzeugen zur Arbeit mit den Inhalten ist wesentlich, denn: Digitale Archive erleichtern nicht nur den Zugriff aus der Ferne und ersparen so manche Forschungsreise. Sie bieten auch die Möglichkeit, Forschungsfragen mittels datenwissenschaftlicher Methoden anzugehen. Sogenannte digitale Geisteswissenschaften untersuchen etwa Aufkommen, Verbreitungsmuster und Kontexte bestimmter Begriffe in Hunderttausenden von Zeitungsartikeln oder Büchern.

Ob retrodigitalisiert oder born digital: Unabdingbar ist die Anreicherung der Archivalien mit Metadaten, die etwa technische Eigenschaften und Kontexte abbilden. Die Bedeutung von Kontextinformationen ist schon für Hobbyfotografen unmittelbar einsichtig: Wann, wo und von wem wurde ein Bild gemacht? Das lässt sich nicht ohne Weiteres der Datei selbst entnehmen.

Auf dem Weg ins digitale Archiv müssen Metadaten teils händisch, teils in automatisierten Prozessen hinzugefügt werden. Die Bestimmung von Auswahl und Struktur der Metadaten ist alles andere als trivial, denn sie formiert die Möglichkeiten zukünftiger Forschungsfragen.

Bei born-digital-Inhalten ist zudem häufig eine Migration nötig. Gründe dafür sind zum einen die Vermeidung proprietärer oder veralteter Formate zugunsten solcher, die auf offenen Standards basieren. Zum anderen reduziert Migration die vorliegende Formatvielfalt. Ein Artefakt bleibt also bei der Übersiedelung ins digitale Archiv nicht identisch.

Die bereits erwähnte Venus von Willendorf ist mit einem Alter von etwa 30.000 Jahren einer der ältesten erhaltenen Kunstgegenstände der Menschheitsgeschichte. Die Kalksteinfigur hat diesen langen Zeitraum absichtslos überdauert und ist durch glücklichen Zufall gefunden worden. Die absichtliche, gar organisierte Bewahrung von Wissen und Kultur ist wesentlich jüngeren Datums. Doch auch die Überlieferungsgeschichte etwa von antiken literarischen Texten und Urkunden ist wechselvoll und von Zufall, Vergessen, Verlieren, Verschütten und Wiederentdecken geprägt.

Die Interpretation eines archäologischen Fundes wie einer Keilschrifttafel versucht, den Bedeutungs- und Funktionszusammenhang zu rekonstruieren, in dem dieses Objekt gestanden haben mag. Eine einzelne Diskette mag zwar künftigen Archäologen Anlass zu Überlegungen geben – das Eigentliche, sprich: der Inhalt, bleibt verborgen. Der funktionale Zusammenhang, in dem die Diskette gestanden hat – sprich: Laufwerk, PC, Betriebssystem, Treiber und Anwendung muss man im Prinzip vollständig rekonstruieren, bevor eine tiefer gehende Interpretation überhaupt möglich ist.