WiWo App Jetzt gratis testen
Anzeigen

Big Data Und das Netz vergisst doch

Während altsyrische Tontafeln noch nach mehr als 3000 Jahren lesbar sind, verweigern elektronische Datenträger nach nur wenigen Jahren den Dienst. Was wird aus unserer Erinnerungskultur, wenn unsere Daten verloren gehen?

Das Internet ist vergesslich. Quelle: Getty Images

Manchmal war Heinrich Böll seiner Zeit voraus. 1957 veröffentlichte er unter dem Titel „Der Wegwerfer“ eine Parabel, die ein Hauptproblem der Informations- und Wissensgesellschaft vorwegzunehmen scheint: Wohin mit all den Daten, die zur Information bereitgestellt werden?

Die Erzählung handelt von dem Angestellten einer Kölner Versicherungsfirma, dessen Aufgabe darin besteht, die eingegangene Post zu sichten und überflüssige Einsendungen wegzuwerfen. Seine unauffällige Tätigkeit, heißt es darin, „dient ausschließlich der Vernichtung“. Prospekte, Reklameschriften, Kunstkataloge, auch Drucksachen landen unbesehen im Reißwolf. Kaum dass sie da sind, sind sie auch schon wieder weg, zwecks Entlastung des Unternehmens.

In Zeiten der Informationsüberflutung, so könnte man Bölls Pointe aktualisieren, komme es nicht darauf an, Informationen zu speichern: Eine kluge, dem Menschen bekömmliche Gedächtnisstrategie gebiete es vielmehr, möglichst viele Informationen auszusondern und zu vernichten. Sie sind Ballast, der nach Befreiung verlangt. Was Böll nicht ahnen konnte: Unter der Herrschaft von Bits und Bytes besorgt die Technik das Vernichtungswerk inzwischen von selbst.

Dass das Netz nicht vergisst, ist eine Legende. Neben dem ununterbrochenen Anschwellen der Datenmengen, der Explosion des Wissens, erleben wir seine Implosion, einen geräuschlosen Informationsverfall, das stille, ungesteuerte, zufällige Verschwinden von Daten.

Aus analog mach digital

Der „Wegwerfer“, halb Segen, halb Fluch, ist heute ins System eingebaut. Die Fachleute sprechen von „digitalem Gedächtnisverlust“, einem Treppenwitz in der Weltgeschichte der Speichermedien: Während altsyrische Tontafeln und altägyptische Papyrusrollen noch nach mehr als 3000 Jahren halt- und lesbar sind, verweigern elektronische Datenträger und Softwareprogramme schon nach wenigen Jahren ihren Dienst.

So wird die Lebenserwartung einer Standardfestplatte auf gerade einmal 50.000 Stunden, also 5,7 Jahre geschätzt, nicht viel mehr als bei einer CD oder DVD, wo schon nach drei Jahren ein zerstörtes Bit den Text oder ein Bild unlesbar machen können.

Nicht nur Materialermüdung, vor allem das beschleunigte Innovationstempo, der immer raschere technische Systemwechsel, sorgt dafür, dass sich die Halbwertszeit der Gedächtnismedien verkürzt. Ob sich eine aktuelle Word-Datei in zehn Jahren noch öffnen lässt, ist fraglich angesichts der Erfahrungen mit älteren Dokumenten: So sind in den Neunzigerjahren auf 5,25-Zoll-Floppy-Disks gespeicherte Dateien mittlerweile unbrauchbar geworden, weil es entsprechende Laufwerke und die dazugehörige Software nicht mehr gibt.

Als Rettungsmittel gilt das Kopieren und Konvertieren: Digitale Inhalte müssen regelmäßig auf neue Trägermedien überspielt werden, damit sie für den Nutzer morgen noch lesbar sind. An die Stelle der dauerhaften Lagerung, ihrer Einschreibung im traditionellen Papierarchiv, tritt so ihre kontinuierliche, immer wieder erneuerte Übertragung in Gestalt von Datenströmen im fluiden Datenarchiv.

Der vergessliche Speicher

So können Sie Ihre Daten online abspeichern
DropboxEiner der bekanntesten Cloud-Speicher-Dienste ist Dropbox. Der US-Anbieter gewährt Nutzern vergleichsweise geringe zwei Gigabyte Gratisspeicher – wer die Dropbox anderen empfiehlt kann den Speicher auf bis zu 16 GB erweitern. Entweder über einen Browser oder über die Applikationen von Dropbox lassen sich Daten hoch- und herunterladen. Installiert man die Software, erscheint sowohl beim Windows- als auch beim Apple-Betriebssystem ein Ordner im Explorer, in dem einfach per kopieren und einfügen Daten in die Cloud und aus ihr herausgeholt werden können. Wer mehr Speicher benötigt, kann bis zu einen Terabyte für 9,99 Euro pro Monat erwerben oder für 99 Euro pro Jahr. Quelle: dpa
Microsoft OneDriveMit einem großen Gratisspeicher lockt Microsoft, das 2015 mit OneDrive den Nachfolger seines Cloud-Speichers SkyDrive präsentierte. 15 Gigabyte winken hier, die auf bis zu 20 Gigabyte erweiterbar sind, indem man etwa neue Kunden wirbt und die automatische Sicherung von Bildern aktiviert. Auch hier können Nutzer entweder über den Browser oder über eine Anwendung auf die Cloud zugreifen. Für 100 GB verlangt Microsoft 70 Cent pro Monat, ein Terabyte ist für günstige sieben Euro monatlich zu haben – inklusive dem Microsoft 365 Office-Paket. Nur die Anbieter Spideroak und Livedrive sind noch günstiger. Quelle: dpa
Spideroak Quelle: Screenshot
Google DriveWie auch Microsoft wartet Google Drive mit 15 Gigabyte Gratisspeicher auf. Neben dem Speicher bietet Google einige zusätzliche Cloud-Dienste wie ein Office-Programm, das mehrere Anwender gemeinsam und parallel bearbeiten können; die Versionskontrolle wird über die Cloud-Software synchronisiert. Wer mehr als die 15 Gigabyte Speicher benötigt, kann für 1,99 Dollar pro Monat 100 GB erwerben, ein Terabyte kostet 9,99 Dollar. Der Speicher ist auf bis zu 30 Terabyte erweiterbar – Kostenpunkt: 299,99 Dollar. Quelle: dpa
Amazon Cloud DriveDas Online-Kaufhaus Amazon bietet mit seinem Dienst „Cloud Drive“ fünf Gigabyte freien Speicherplatz für die ersten zwölf Monate. Bei Amazon erworbene MP3-Dateien werden direkt auf der Online-Festplatte abgelegt. 50 Gigabyte sind ab 20 Euro pro Jahr zu haben, ein Terabyte ab 400 Euro. Quelle: dpa
Apples iCloudApple-Nutzer erhalten fünf Gigabyte Cloud-Speicher gratis. Sofern ein iPhone-Nutzer keine anderen Einstellungen vornimmt, landen sämtliche Fotos, die er mit seinem Smartphone schießt, in der Cloud. Auch auf Kontakt-Daten, Termine und andere Anwendungen greift die Cloud zu. Solange man ausschließlich Apple-Geräte nutzt, ist die Synchronisation einer der Aspekte, mit denen Apple besonders punktet. Speichererweiterungen sind problemlos möglich: 50 Gigabyte sind für 99 Cent pro Monat erhältlich, ein Terabyte kostet 9,99 Euro – und damit das Doppelte des Dropbox-Preises. Quelle: dpa
ADrive Quelle: Screenshot

Im Zeichen des Binärcodes verflüssigen sich die Bestände. Das digitale Gedächtnis ist „flüchtig“, sagt der in Oxford lehrende Philosoph Luciano Floridi, „flüchtig, wie es unsere mündliche Kultur einst war“. Es sichert Wissen on demand, prämiert die Gegenwart, den schnellen Zugriff auf Daten, die Kommunikation in Echtzeit.

In seiner Archivfunktion hingegen ist es unterentwickelt, gleicht es einem vergesslichen Speicher, der Daten sammelt, um sie alsbald wieder zu überschreiben. Selbst wenn riesige Altdatenmengen regelmäßig auf neuen Datenträgern verjüngt werden: Es hilft nichts, auch Big Data wird „altern“, wird zu „Dead Data“ werden, prophezeit Floridi – und fordert nicht nur eine neue „Datenrettungsindustrie“, sondern die Arbeit eines „Informationskurators“, der sich die „Bewahrung unseres zunehmend digitalen kulturellen Erbes für künftige Generationen“ zum Ziel setzt.

Eine öffentliche Aufgabe: Denn die Verluste schmerzen nicht nur den Privatmann, der feststellt, dass Hunderte der digitalen Fotos, die er vor Jahren mit dem Smartphone gemacht hat, nicht mehr zugänglich sind. Sie bedrohen auch das kulturelle Gedächtnis, also Texte, Symbole, Bilder und Filme. Sie bringen die offiziellen Gedächtnisinstitutionen in Verlegenheit: Archive, Bibliotheken, Mediatheken und Museen stehen mit den beschleunigten Zyklen vor neuen, teuren Konservierungsaufgaben.

Lücken in der Überlieferung durch medientechnische Epochenumbrüche

„Meist kommen die Archive zu spät“, sagt Paul Klimpel, einer der Initiatoren des Berliner Appells zum Erhalt des digitalen Kulturerbes. Der Jurist und Kulturmanager, der jahrelang Verwaltungschef der Deutschen Kinemathek war, verweist auf die medientechnischen Epochenumbrüche, die zu „extremen Lücken in der Überlieferung“ geführt hätten: „Wenn ein neues Medium aufkommt, denkt man an die zukünftigen Möglichkeiten, die in ihm stecken, an Fragen der Verbreitung und Vermarktung, aber nicht an Erhaltung.“

Mit der Folge, dass die ersten Radioaufnahmen ebenso verloren gingen wie die meisten Fernsehaufnahmen aus der jungen Bundesrepublik: Die MAZ-Bänder wurden einfach überspielt.

Klimpel warnt davor, die Fehler der Vergangenheit angesichts einer Medienrevolution zu wiederholen, die ungleich radikalere Auswirkungen habe als ihre Vorgänger und nahezu alle Lebensbereiche umfasse. Man müsse jetzt handeln, wo noch vieles zu retten ist. Leider sei Vorsorge „überhaupt nicht sexy“. Für Pflege und Konservierung gebe es kaum Applaus. Schon deshalb, weil der Serverpark zur Sicherung von Daten für das Publikum unsichtbar ist.

Hinzu kommt, dass die Erhaltung von digitalen Inhalten nichts Zufälliges ist. Digitalia erfordern, anders als Analogia, ein „aktives Bewahren“. Das gilt für den Wissenschaftler, der nicht sicher sein kann, dass die Internetquelle, die er zitiert, auch noch nach zehn Jahren nachprüfbar ist. Aber auch für den normalen Nutzer, der seine Onlinebiografie sichern muss, wenn er einen neuen Rechner kauft.

Im Unterschied zu Feldpostbriefen, die man noch nach Jahren unversehrt auf dem Dachboden findet, muss man sich um die Konservierung von E-Mails selber kümmern. Doch das passiert selten. Weil es lästig und aufwendig ist, weil es technischen Sachverstand erfordert, weil man Kommentare in Blogs und Chats nicht für aufbewahrenswert hält.

Von der Aufregung um die Staatsaffäre Böhmermann in den digitalen Echoräumen wird nach fünf Jahren mutmaßlich nicht mehr viel übrig sein. Womöglich, so Klimpel, werden Historiker, die sich nicht nur für Aktenvermerke interessieren, die Leerstelle bedauern. Sie stoßen schon heute auf Lücken.

Für den Bremer Digitalhistoriker Jens Crueger drohen Teile der frühen Internetkultur „im Dunkel der Geschichte zu vergehen“. Sein Paradebeispiel ist der Webhosting-Dienst Geocities, „weltweite Heimat“ für private Webseiten mit Kunst und Musik, ein „frühes Modell für den entspannten Umgang mit dem Urheberrecht“. Als der Dienst 2009 eingestellt wurde, konnten nur wenige Seiten für die Nachwelt gerettet werden.

Die schönsten Bibliotheken der Welt
Vatikanische apostolische Bibliothek Sie wurde im 16. Jahrhundert gebaut und wird heute noch von zahlreichen Gästen genutzt - nicht nur wegen ihrer Optik, sondern auch wegen der vorhandenen Schriftstücke. Der Buchbestand wird zum wertvollsten der Welt gezählt, insgesamt zwei Millionen Bücher und Manuskripte befinden sich im Besitz der Bibliothek im Vatikan. Quelle: GNU
StockholmDie seit 1928 bestehende Stadtbibliothek Stockholm markiert den Umbruch der schwedischen Architektur der Zeit. Die klare Struktur des Äußeren zieht sich im Inneren fort, rundlaufende Regale säumen den zylindrischen Innenraum des Hauptgebäudes. Insgesamt wird der Medienbestand auf über zwei Millionen Büchern und über 2,4 Millionen Audiokassetten, CDs und Hörbüchern beziffert. Quelle: Creative Commons
BaltimoreDie George Peabody-Bibliothek in Baltimore stammt aus dem 19. Jahrhundert. 1878 fertiggestellt, vereinigt das neugriechische Interieur ein mit Marmor ausgelegtes Atrium mit 18 Metern Deckenhöhe - ein Grund dafür, dass das Gebäude ursprünglich auch als "Kathedrale der Bücher" bezeichnet wurde. Vor rund zehn Jahren wurde die komplette Bibliothek renoviert und überarbeitet. Quelle: Gemeinfrei
ZürichEine ungewöhnlich verortete Bibliothek findet sich im B2-Hotel in Zürich. Den Gästen stehen insgesamt rund 33.000 Bücher in elf Meter hohen Regalen zur freien Verfügung. Wer möchte, kann die Bücher sogar ausleihen. Quelle: PR
Den HaagDie ursprüngliche Bibliothek des niederländischen Justizministeriums beherbergt sämtliche Unterlagen des Senats und des Repräsentantenhauses. Das Gebäude wurde Ende des 19. Jahrhunderts gebaut. Um die wertvollen Unterlagen zu schützen, wurde auf eine Beleuchtung durch Kerzen und Gaslampen verzichtet. Stattdessen setzten die Baumeister auf ein komplett verglastes Dach und eine ausgeklügelte Etagenstruktur. Quelle: GNU
AdmontDie größte Klosterbibliothek der Welt befindet sich im österreichischen Benediktinerstift Admont. Das Ziel der Baumeisters Josef Hueber: "Wie den Verstand soll auch den Raum Licht erfüllen." Der in drei Teile gegliederte Raum ist 70 Meter lang, 14 Meter breit und 11 Meter hocch. An der Decke stellen Fresken die Stufen der menschlichen Erkenntnis dar. Quelle: PR
WienDer Prunksaal der Österreichischen Nationalbibliothek wurde im Jahr 1726 fertiggestellt und ist in eine Kriegs- und eine Friedensseite aufgeteilt, die sich in den vorhandenen Fresken widerspiegeln. Neben dem Archiv aller in Österreich veröffentlichten Büchern verfügt die Bibliothek über einen umfangreichen Bestand alter Karten und Globen sowie eine Sammlung alter Papyrus-Schriftstücke. Quelle: Creative Commons

Die Aura des Unikats

Doch auch der bundesdeutsche Alltag, zu dem spätestens seit Mitte der Neunzigerjahre essenziell die Onlineperspektive gehöre, von Ebay über E-Games bis zum Katzenfoto-Hype, sei nur lückenhaft dokumentiert. Für den späteren Kulturhistoriker des Onlineshoppings könnten sie sich als „Dark Ages“ herausstellen. Dabei ergeben sich, wie Crueger meint, für die Kulturgeschichtsschreibung ganz neue Möglichkeiten durch das Netz: Griff sie früher vor allem auf Briefe und Tagebücher zurück, eröffnet sich ihr heute das riesige Potenzial der sozialen Medien mit ihren Chat-, Foren- und Blogbeiträgen – für die Alltagsgeschichte eine „Revolution“.

Erfindungen, die sich zu Recht gehalten haben
Disketten liegen auf einem Haufen Quelle: Fotolia
Tonbandgerät Quelle: Fotolia
Schallplatte Quelle: Fotolia
Schreibmaschinentastatur Quelle: Fotolia
Cessna 172 Quelle: Fotolia
Flipper Quelle: Fotolia
Stethoskop Quelle: dpa

Trotzdem, die meisten Historiker meiden den Umgang mit Internetquellen. Nicht nur, so Crueger, weil sie Angst haben vor der „Geschichte der letzten fünf Minuten“, sondern weil die Quellenlage im digitalen Raum komplex ist. So ist der Unterschied zwischen Original und Kopie weitgehend sinnlos geworden. Wenn nur noch vervielfältigt wird, geht die Aura des Unikats verloren. Stattdessen stellt sich die Frage nach der „Authentizität der Quelle“.

Ist auf die Autorschaft eines Textes angesichts der digitalen Manipulationsmöglichkeiten Verlass? Hat er mehrere Autoren und Varianten? Stehen sie in einer hierarchischen Beziehung? Sind Versionen gelöscht worden?

Crueger plädiert dafür, die Historiker stärker in die Pflicht zu nehmen, wenn es darum geht, den Archivaren Kriterien für die Speicherung von Quellen an die Hand zu geben. So genüge es nicht immer, eine Webseite per Screenshot zu fotografieren, zuweilen sei es sinnvoll, ihren Quellcode abzuspeichern. Bei den Nachrichtenportalen, die in immer kürzerem Takt aktualisiert werden, müssten zudem, nach historisch-kritischem Maßstab, auch die Zwischenversionen erschließbar sein.

Was soll aufbewahrt werden und wer entscheidet darüber?

Eine Herkulesarbeit: Welche Teile der immer größer werdenden Datenflut sollen bewahrt werden? Und wer entscheidet darüber, was wir in Zukunft über die Vergangenheit wissen können? Archivare oder Algorithmen? Die Deutsche Nationalbibliothek hat 2006 vom Gesetzgeber den Auftrag erhalten, das Internet zu archivieren, „im Original“, wie es heißt.

Tatsächlich beschränkt sie sich auf die Sammlung digital publizierter Bücher, von E- bis Audio-Books, und gelegentliches Web-Harvesting: Roboter gehen über die Netz-Bestände und machen selektive Schnappschüsse, Momentaufnahmen im Fluss des Datenstroms.

Eigentlich ein illegales Vorgehen, das gegen das Urheberrecht verstößt: Es werden Raubkopien erstellt. Ein willkürliches obendrein, denn welche Bestände in die „Arche Noah des digitalen Wissens“ (Jurist und Urheberrechtsexperte Thomas Dreier) aufgenommen werden, was den Kern des kulturellen Gedächtnis ausmacht, bleibt mehr oder weniger dem Zufall überlassen.

In der analogen Welt sei das anders gewesen, sagt Eric Steinhauer, Dezernent für Medienbearbeitung an der Universitätsbibliothek Hagen: „Der Suhrkamp-Gedichtband gehörte dazu, die Edeka-Reklame nicht und das Telefongespräch schon gar nicht.“ Im digitalen Raum sei das nicht mehr zu trennen: „Hier konvergieren alle Arten von Veröffentlichungen zu einem einzigen großen Datenstrom.“ Die Hierarchien schwinden und damit auch die Relevanzkriterien. Die Welt neigt dazu, zum Archiv ihrer selbst zu werden: „Man ist nur noch mit Speichern und Kopieren beschäftigt, das kann nicht funktionieren.“

Die Nötigung zur Auswahl, zum regelgeleiteten Filtern bleibt. Auch wenn Big Data demnächst ermittelt, welche Daten erhaltenswert sind. Zur Erinnerung, so Steinhauer, gehöre immer auch das Vergessen. Es schützt vor Erstarrung, es schafft „Platz für die Gegenwart und die Zukunft“. Selbst die Bibliotheken seien als Gedächtnisinstitutionen immer auch Orte gewesen, wo man Publikationen „mit Anstand verschwinden lassen konnte“: Ihre „diskrete, aber gut funktionierende Löschstrategie“ beruhte darauf, dass Bücher langsam zerfallen, in Vergessenheit geraten, und wenn sie Glück haben, irgendwann eine Renaissance in neuen Auflagen erfahren.

Technik, die Kinder nicht mehr kennen
Disketten Quelle: dpa/picture-alliance
Die Schreibmaschine Quelle: dpa/picture-alliance
Film wechseln Quelle: dpa/picture-alliance
Das Telefon mit Wählscheibe Quelle: dpa/picture-alliance
Die Musikkassette Quelle: dpa/picture-alliance
Der Walkman Quelle: REUTERS
Das Faxgerät Quelle: dpa/picture-alliance

Angeln im Datenmeer

Die Tragik des digitalen Zeitalters, so Steinhauer, beruhe darauf, dass man den Dingen keine Zeit mehr lässt zu veralten, sodass sie noch eine lange Zeit wiederentdeckt werden können. Hier gilt: Weg ist weg. Deshalb müsse man die Archivierungsmethoden „den neuen Medien anpassen“, nicht umgekehrt. Es gehe um „fließende Zusammenhänge“, nicht um „Schnappschüsse“.

Sein Vorschlag: Neben „klassischen“ Netzpublikationen wie etwa Onlinedissertationen auch genuine Internetprodukte wie Blogs „exemplarisch“ zu sammeln und, darüber hinaus, wie mit einem großen Staubsauger im Wege des Harvesting digitale Netzinhalte in einem Reservoir zu speichern, das die kulturelle Überlieferung „großflächig“ sichern soll: Dann geht man Angeln im Datenmeer.

Digitale „Langzeitarchivierung“ ist eine Aufgabe, die nach dem öffentlichen Diskurs verlangt und nur „auf Bundesebene“ bewältigt werden könnte, durch Institutionalisierung in Form einer neu zu schaffenden Gedächtniseinrichtung. Die viel beklagte Überfülle wäre dabei nicht das größte Problem. Es wurde schon immer mehr gespeichert, als unser Gedächtnis aufnehmen kann.

In Big Data liegt auch eine Chance für den historischen Sinn. Bisher hat das Internet wie ein Scheibenwischer gewirkt, hat uns, wie die Gedächtnisforscherin Aleida Assmann einmal gesagt hat, „für jeden Tag die frische Tabula rasa“ angeboten, Stoff für den schnellen Gebrauch und Verbrauch.

Es hat uns, so Floridi, fortwährend aktualisierte Webseiten geliefert, „tausendfach“ umgeschriebene Dokumente „ohne Erinnerung an die eigene Geschichte“. Dass Texte dabei verschwanden, gehörte zum Prinzip. Vielleicht würde durch eine Reform der digitalen Archivierung die Archivfunktion des Internets gestärkt. Was es dafür bräuchte? „Mehr öffentliche Aufmerksamkeit“, sagt Paul Klimpel, „mehr Vorsorge, womöglich einen GAU.“ Wie beim Brand der Anna-Amalia-Bibliothek in Weimar im September 2004. „Zerstörte Gedächtnisspuren lösen stärkste Emotionen aus“, sagt Eric Steinhauer: „Erst brennt’s, dann denkt’s.“

© Handelsblatt GmbH – Alle Rechte vorbehalten. Nutzungsrechte erwerben?
Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%