Neben Deutschlands neuem Supercomputer hat das Leibniz Rechenzentrum in München auch ein modernes Archivierungszentrum erhalten. Daran lassen sich die Probleme und Entwicklungen bei der Langzeitarchivierung von Daten aufzeigen.
Ein komplettes Stockwerk im neuen Rechnerwürfel des Leibniz-Rechenzentrums – eine Halle mit 500 m² Stellfläche – wird ausschließlich zur Datenhaltung genutzt. Die Halle wird im internen Sprachgebrauch des Leibniz-Rechenzentrums DAR genannt. DAR steht für Daten- und Archiv-Raum. Das klingt nach Beständigkeit, Stille, nach langen Regalreihen, in denen Tausende Bücher und Aktenordner im Halbdunkel jahrzehntelang friedlich verstauben. Nur ab und an kommt ein Archivar vorbei und sieht nach dem Rechten oder holt sich einen Ordner.
Kubisch: Der "Rechnerwürfel" beherbergt sämtliche Server des LRZ inklusive des neuen Supercomputers. (Quelle: LRZ)
Was das Halbdunkel und die langen Regalreihen anbelangt, ist dieses Bild gar nicht so falsch. DAR hat keine Fenster und die Notbeleuchtung verbreitet nur schummriges Licht. Es gibt tatsächlich lange Regalreihen, in denen viele tausend Magnetbandkassetten lagern und darauf warten, von einem Roboter abgeholt zu werden. Der Rest des Bildes bedarf jedoch einiger Richtigstellungen.
Zehnjähriges Jubiläum
Das Archiv- und Backupsystem des LRZ ist in seiner heutigen Form seit Januar 1996 in Betrieb. Zwar dürfte ein Teil der Daten im DAR durchaus zehn Jahre alt sein, die Medien, auf denen diese Daten gespeichert sind, sind es definitiv nicht: die ältesten Kassetten in den Regalen des DAR wurden 2003 beschafft. Von „jahrzehntelangem Dahinschlummern“ kann also kaum die Rede sein, auch dann nicht, wenn kein rüder Rechenzentrumsumzug die Archive wachrüttelt.
Raumfüllend: Die Bandbibliotheken im Daten- und Archivraum. (Quelle: Bayerischen Akademie der Wissenschaften)
Im scharfen Kontrast zu traditionellen Informationsspeichern (z. B. dem Buch) spricht man bei der Lebensdauer von Speichermedien in der IT-Welt faktisch nicht über Jahrzehnte und schon gar nicht über Jahrhunderte, sondern einen Zeitraum von wenigen Jahren: Bei keinem Speichermedium kann hundertprozentig sichergestellt werden, dass es nach mehr als 10 Jahren noch gelesen werden kann.
Dabei ist nicht allein die physische Haltbarkeit des Informationsspeichers ausschlaggebend, sondern die Verfügbarkeit der hardware- und softwaremäßigen Zugriffsmöglichkeiten. Es gibt keine Garantie dafür, dass die Lesegeräte über viele Jahre hinweg verfügbar und funktionstüchtig gehalten werden können, und dass die dazu notwendigen systemtechnischen Vorbedingungen (im Wesentlichen die Verfügbarkeit der verarbeitenden Computer und deren Software) aufrecht erhalten werden können.