Big Data: Und das Netz vergisst doch

ThemaInternet

Big Data: Und das Netz vergisst doch

Bild vergrößern

Das Internet ist vergesslich.

von Christopher Schwarz

Während altsyrische Tontafeln noch nach mehr als 3000 Jahren lesbar sind, verweigern elektronische Datenträger nach nur wenigen Jahren den Dienst. Was wird aus unserer Erinnerungskultur, wenn unsere Daten verloren gehen?

Manchmal war Heinrich Böll seiner Zeit voraus. 1957 veröffentlichte er unter dem Titel „Der Wegwerfer“ eine Parabel, die ein Hauptproblem der Informations- und Wissensgesellschaft vorwegzunehmen scheint: Wohin mit all den Daten, die zur Information bereitgestellt werden?

Die Erzählung handelt von dem Angestellten einer Kölner Versicherungsfirma, dessen Aufgabe darin besteht, die eingegangene Post zu sichten und überflüssige Einsendungen wegzuwerfen. Seine unauffällige Tätigkeit, heißt es darin, „dient ausschließlich der Vernichtung“. Prospekte, Reklameschriften, Kunstkataloge, auch Drucksachen landen unbesehen im Reißwolf. Kaum dass sie da sind, sind sie auch schon wieder weg, zwecks Entlastung des Unternehmens.

Anzeige

In Zeiten der Informationsüberflutung, so könnte man Bölls Pointe aktualisieren, komme es nicht darauf an, Informationen zu speichern: Eine kluge, dem Menschen bekömmliche Gedächtnisstrategie gebiete es vielmehr, möglichst viele Informationen auszusondern und zu vernichten. Sie sind Ballast, der nach Befreiung verlangt. Was Böll nicht ahnen konnte: Unter der Herrschaft von Bits und Bytes besorgt die Technik das Vernichtungswerk inzwischen von selbst.

Dass das Netz nicht vergisst, ist eine Legende. Neben dem ununterbrochenen Anschwellen der Datenmengen, der Explosion des Wissens, erleben wir seine Implosion, einen geräuschlosen Informationsverfall, das stille, ungesteuerte, zufällige Verschwinden von Daten.

Aus analog mach digital

  • Dias

    Für verregnete Sonntage: Diascanner (ab 60 Euro) verwandeln pro Minute 20 Dias in digitale Bilder.

  • Disketten

    Einfach einen Diskettenadapter (rund 30 Euro) über das USB-Kabel an einen Computer anschließen.

  • Super-8-Filme

    Professionelle Dienstleister nehmen je nach Aufwand durchschnittlich 1,50 Euro pro Minute.

  • Videokassetten

    Ein Videograbber verbindet den Videorecorder mit dem Computer. Preis: etwa 100 Euro.

Der „Wegwerfer“, halb Segen, halb Fluch, ist heute ins System eingebaut. Die Fachleute sprechen von „digitalem Gedächtnisverlust“, einem Treppenwitz in der Weltgeschichte der Speichermedien: Während altsyrische Tontafeln und altägyptische Papyrusrollen noch nach mehr als 3000 Jahren halt- und lesbar sind, verweigern elektronische Datenträger und Softwareprogramme schon nach wenigen Jahren ihren Dienst.

So wird die Lebenserwartung einer Standardfestplatte auf gerade einmal 50.000 Stunden, also 5,7 Jahre geschätzt, nicht viel mehr als bei einer CD oder DVD, wo schon nach drei Jahren ein zerstörtes Bit den Text oder ein Bild unlesbar machen können.

Daten-Wolke Alles, was Sie jetzt über die Cloud wissen müssen

Im Internet führt an Cloud-Diensten kein Weg mehr vorbei. Umso wichtiger ist es, zu durchblicken, was die Cloud ist und wo sie sich verbirgt. Die wichtigsten Antworten im Überblick.

Cloud-Computing ist eigentlich ganz einfach. Quelle: Getty Images

Nicht nur Materialermüdung, vor allem das beschleunigte Innovationstempo, der immer raschere technische Systemwechsel, sorgt dafür, dass sich die Halbwertszeit der Gedächtnismedien verkürzt. Ob sich eine aktuelle Word-Datei in zehn Jahren noch öffnen lässt, ist fraglich angesichts der Erfahrungen mit älteren Dokumenten: So sind in den Neunzigerjahren auf 5,25-Zoll-Floppy-Disks gespeicherte Dateien mittlerweile unbrauchbar geworden, weil es entsprechende Laufwerke und die dazugehörige Software nicht mehr gibt.

Als Rettungsmittel gilt das Kopieren und Konvertieren: Digitale Inhalte müssen regelmäßig auf neue Trägermedien überspielt werden, damit sie für den Nutzer morgen noch lesbar sind. An die Stelle der dauerhaften Lagerung, ihrer Einschreibung im traditionellen Papierarchiv, tritt so ihre kontinuierliche, immer wieder erneuerte Übertragung in Gestalt von Datenströmen im fluiden Datenarchiv.

Der vergessliche Speicher

Im Zeichen des Binärcodes verflüssigen sich die Bestände. Das digitale Gedächtnis ist „flüchtig“, sagt der in Oxford lehrende Philosoph Luciano Floridi, „flüchtig, wie es unsere mündliche Kultur einst war“. Es sichert Wissen on demand, prämiert die Gegenwart, den schnellen Zugriff auf Daten, die Kommunikation in Echtzeit.

In seiner Archivfunktion hingegen ist es unterentwickelt, gleicht es einem vergesslichen Speicher, der Daten sammelt, um sie alsbald wieder zu überschreiben. Selbst wenn riesige Altdatenmengen regelmäßig auf neuen Datenträgern verjüngt werden: Es hilft nichts, auch Big Data wird „altern“, wird zu „Dead Data“ werden, prophezeit Floridi – und fordert nicht nur eine neue „Datenrettungsindustrie“, sondern die Arbeit eines „Informationskurators“, der sich die „Bewahrung unseres zunehmend digitalen kulturellen Erbes für künftige Generationen“ zum Ziel setzt.

Eine öffentliche Aufgabe: Denn die Verluste schmerzen nicht nur den Privatmann, der feststellt, dass Hunderte der digitalen Fotos, die er vor Jahren mit dem Smartphone gemacht hat, nicht mehr zugänglich sind. Sie bedrohen auch das kulturelle Gedächtnis, also Texte, Symbole, Bilder und Filme. Sie bringen die offiziellen Gedächtnisinstitutionen in Verlegenheit: Archive, Bibliotheken, Mediatheken und Museen stehen mit den beschleunigten Zyklen vor neuen, teuren Konservierungsaufgaben.

Lücken in der Überlieferung durch medientechnische Epochenumbrüche

„Meist kommen die Archive zu spät“, sagt Paul Klimpel, einer der Initiatoren des Berliner Appells zum Erhalt des digitalen Kulturerbes. Der Jurist und Kulturmanager, der jahrelang Verwaltungschef der Deutschen Kinemathek war, verweist auf die medientechnischen Epochenumbrüche, die zu „extremen Lücken in der Überlieferung“ geführt hätten: „Wenn ein neues Medium aufkommt, denkt man an die zukünftigen Möglichkeiten, die in ihm stecken, an Fragen der Verbreitung und Vermarktung, aber nicht an Erhaltung.“

Mit der Folge, dass die ersten Radioaufnahmen ebenso verloren gingen wie die meisten Fernsehaufnahmen aus der jungen Bundesrepublik: Die MAZ-Bänder wurden einfach überspielt.

Mediennutzung Die Deutschen lieben Bücher

DVDs oder CDs im Wohnzimmer werden seltener, stattdessen geht der Trend zum Streaming von Serien, Filmen und Musik. Doch wie wichtig ist der Trend den Deutschen wirklich? Eine Umfrage zeigt erstaunliche Ergebnisse.

Musik Apps Quelle: dpa

Klimpel warnt davor, die Fehler der Vergangenheit angesichts einer Medienrevolution zu wiederholen, die ungleich radikalere Auswirkungen habe als ihre Vorgänger und nahezu alle Lebensbereiche umfasse. Man müsse jetzt handeln, wo noch vieles zu retten ist. Leider sei Vorsorge „überhaupt nicht sexy“. Für Pflege und Konservierung gebe es kaum Applaus. Schon deshalb, weil der Serverpark zur Sicherung von Daten für das Publikum unsichtbar ist.

Hinzu kommt, dass die Erhaltung von digitalen Inhalten nichts Zufälliges ist. Digitalia erfordern, anders als Analogia, ein „aktives Bewahren“. Das gilt für den Wissenschaftler, der nicht sicher sein kann, dass die Internetquelle, die er zitiert, auch noch nach zehn Jahren nachprüfbar ist. Aber auch für den normalen Nutzer, der seine Onlinebiografie sichern muss, wenn er einen neuen Rechner kauft.

Im Unterschied zu Feldpostbriefen, die man noch nach Jahren unversehrt auf dem Dachboden findet, muss man sich um die Konservierung von E-Mails selber kümmern. Doch das passiert selten. Weil es lästig und aufwendig ist, weil es technischen Sachverstand erfordert, weil man Kommentare in Blogs und Chats nicht für aufbewahrenswert hält.

Von der Aufregung um die Staatsaffäre Böhmermann in den digitalen Echoräumen wird nach fünf Jahren mutmaßlich nicht mehr viel übrig sein. Womöglich, so Klimpel, werden Historiker, die sich nicht nur für Aktenvermerke interessieren, die Leerstelle bedauern. Sie stoßen schon heute auf Lücken.

Für den Bremer Digitalhistoriker Jens Crueger drohen Teile der frühen Internetkultur „im Dunkel der Geschichte zu vergehen“. Sein Paradebeispiel ist der Webhosting-Dienst Geocities, „weltweite Heimat“ für private Webseiten mit Kunst und Musik, ein „frühes Modell für den entspannten Umgang mit dem Urheberrecht“. Als der Dienst 2009 eingestellt wurde, konnten nur wenige Seiten für die Nachwelt gerettet werden.

Die Aura des Unikats

Doch auch der bundesdeutsche Alltag, zu dem spätestens seit Mitte der Neunzigerjahre essenziell die Onlineperspektive gehöre, von Ebay über E-Games bis zum Katzenfoto-Hype, sei nur lückenhaft dokumentiert. Für den späteren Kulturhistoriker des Onlineshoppings könnten sie sich als „Dark Ages“ herausstellen. Dabei ergeben sich, wie Crueger meint, für die Kulturgeschichtsschreibung ganz neue Möglichkeiten durch das Netz: Griff sie früher vor allem auf Briefe und Tagebücher zurück, eröffnet sich ihr heute das riesige Potenzial der sozialen Medien mit ihren Chat-, Foren- und Blogbeiträgen – für die Alltagsgeschichte eine „Revolution“.

Trotzdem, die meisten Historiker meiden den Umgang mit Internetquellen. Nicht nur, so Crueger, weil sie Angst haben vor der „Geschichte der letzten fünf Minuten“, sondern weil die Quellenlage im digitalen Raum komplex ist. So ist der Unterschied zwischen Original und Kopie weitgehend sinnlos geworden. Wenn nur noch vervielfältigt wird, geht die Aura des Unikats verloren. Stattdessen stellt sich die Frage nach der „Authentizität der Quelle“.

Ist auf die Autorschaft eines Textes angesichts der digitalen Manipulationsmöglichkeiten Verlass? Hat er mehrere Autoren und Varianten? Stehen sie in einer hierarchischen Beziehung? Sind Versionen gelöscht worden?

Crueger plädiert dafür, die Historiker stärker in die Pflicht zu nehmen, wenn es darum geht, den Archivaren Kriterien für die Speicherung von Quellen an die Hand zu geben. So genüge es nicht immer, eine Webseite per Screenshot zu fotografieren, zuweilen sei es sinnvoll, ihren Quellcode abzuspeichern. Bei den Nachrichtenportalen, die in immer kürzerem Takt aktualisiert werden, müssten zudem, nach historisch-kritischem Maßstab, auch die Zwischenversionen erschließbar sein.

Was soll aufbewahrt werden und wer entscheidet darüber?

Eine Herkulesarbeit: Welche Teile der immer größer werdenden Datenflut sollen bewahrt werden? Und wer entscheidet darüber, was wir in Zukunft über die Vergangenheit wissen können? Archivare oder Algorithmen? Die Deutsche Nationalbibliothek hat 2006 vom Gesetzgeber den Auftrag erhalten, das Internet zu archivieren, „im Original“, wie es heißt.

Tatsächlich beschränkt sie sich auf die Sammlung digital publizierter Bücher, von E- bis Audio-Books, und gelegentliches Web-Harvesting: Roboter gehen über die Netz-Bestände und machen selektive Schnappschüsse, Momentaufnahmen im Fluss des Datenstroms.

Eigentlich ein illegales Vorgehen, das gegen das Urheberrecht verstößt: Es werden Raubkopien erstellt. Ein willkürliches obendrein, denn welche Bestände in die „Arche Noah des digitalen Wissens“ (Jurist und Urheberrechtsexperte Thomas Dreier) aufgenommen werden, was den Kern des kulturellen Gedächtnis ausmacht, bleibt mehr oder weniger dem Zufall überlassen.

Digitalisierung Gabriels Digitalisierungsbefehl ist realitätsfremd

Nach der CeBIT scheint die Sache klar: Deutschland ist auf dem Weg in die digitale Zukunft, Sigmar Gabriel hat Digitalisierung befohlen. Doch für die Unternehmen sieht die Sache anders aus. Es braucht einen Kulturwandel.

Digitalisierung Retro: Wie weit sind wir wirklich? Quelle: Getty Images

In der analogen Welt sei das anders gewesen, sagt Eric Steinhauer, Dezernent für Medienbearbeitung an der Universitätsbibliothek Hagen: „Der Suhrkamp-Gedichtband gehörte dazu, die Edeka-Reklame nicht und das Telefongespräch schon gar nicht.“ Im digitalen Raum sei das nicht mehr zu trennen: „Hier konvergieren alle Arten von Veröffentlichungen zu einem einzigen großen Datenstrom.“ Die Hierarchien schwinden und damit auch die Relevanzkriterien. Die Welt neigt dazu, zum Archiv ihrer selbst zu werden: „Man ist nur noch mit Speichern und Kopieren beschäftigt, das kann nicht funktionieren.“

Die Nötigung zur Auswahl, zum regelgeleiteten Filtern bleibt. Auch wenn Big Data demnächst ermittelt, welche Daten erhaltenswert sind. Zur Erinnerung, so Steinhauer, gehöre immer auch das Vergessen. Es schützt vor Erstarrung, es schafft „Platz für die Gegenwart und die Zukunft“. Selbst die Bibliotheken seien als Gedächtnisinstitutionen immer auch Orte gewesen, wo man Publikationen „mit Anstand verschwinden lassen konnte“: Ihre „diskrete, aber gut funktionierende Löschstrategie“ beruhte darauf, dass Bücher langsam zerfallen, in Vergessenheit geraten, und wenn sie Glück haben, irgendwann eine Renaissance in neuen Auflagen erfahren.

Angeln im Datenmeer

Die Tragik des digitalen Zeitalters, so Steinhauer, beruhe darauf, dass man den Dingen keine Zeit mehr lässt zu veralten, sodass sie noch eine lange Zeit wiederentdeckt werden können. Hier gilt: Weg ist weg. Deshalb müsse man die Archivierungsmethoden „den neuen Medien anpassen“, nicht umgekehrt. Es gehe um „fließende Zusammenhänge“, nicht um „Schnappschüsse“.

Sein Vorschlag: Neben „klassischen“ Netzpublikationen wie etwa Onlinedissertationen auch genuine Internetprodukte wie Blogs „exemplarisch“ zu sammeln und, darüber hinaus, wie mit einem großen Staubsauger im Wege des Harvesting digitale Netzinhalte in einem Reservoir zu speichern, das die kulturelle Überlieferung „großflächig“ sichern soll: Dann geht man Angeln im Datenmeer.

Digitale „Langzeitarchivierung“ ist eine Aufgabe, die nach dem öffentlichen Diskurs verlangt und nur „auf Bundesebene“ bewältigt werden könnte, durch Institutionalisierung in Form einer neu zu schaffenden Gedächtniseinrichtung. Die viel beklagte Überfülle wäre dabei nicht das größte Problem. Es wurde schon immer mehr gespeichert, als unser Gedächtnis aufnehmen kann.

In Big Data liegt auch eine Chance für den historischen Sinn. Bisher hat das Internet wie ein Scheibenwischer gewirkt, hat uns, wie die Gedächtnisforscherin Aleida Assmann einmal gesagt hat, „für jeden Tag die frische Tabula rasa“ angeboten, Stoff für den schnellen Gebrauch und Verbrauch.

Digitalisierung Britische Firmen sind digital, deutsche analog

Auf der CeBit, die am 14. März beginnt, ist die digitale Transformation das Thema Nummer eins. Aber wie steht es wirklich um die Digitalisierung in den Unternehmen? Eine Umfrage zeigt: Deutschland hat noch Nachholbedarf.

Britische Unternehmen führen auf dem Weg in die digitale Zukunft / Deutschland hat bei der Transformation Nachholbedarf.  Quelle: dpa

Es hat uns, so Floridi, fortwährend aktualisierte Webseiten geliefert, „tausendfach“ umgeschriebene Dokumente „ohne Erinnerung an die eigene Geschichte“. Dass Texte dabei verschwanden, gehörte zum Prinzip. Vielleicht würde durch eine Reform der digitalen Archivierung die Archivfunktion des Internets gestärkt. Was es dafür bräuchte? „Mehr öffentliche Aufmerksamkeit“, sagt Paul Klimpel, „mehr Vorsorge, womöglich einen GAU.“ Wie beim Brand der Anna-Amalia-Bibliothek in Weimar im September 2004. „Zerstörte Gedächtnisspuren lösen stärkste Emotionen aus“, sagt Eric Steinhauer: „Erst brennt’s, dann denkt’s.“

Anzeige
Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%