WiWo App Jetzt gratis testen
Anzeigen

Big Data Wie uns die eigenen Daten verdächtig machen

Seite 2/5

Verräterische Suchanfrage

Dadurch konnten zwar unterschiedliche Suchanfragen noch als von einer einzigen Person stammend ausgemacht, aber nicht mehr festgestellt werden, wer diese Person war. Zumindest war das der Plan. Denn innerhalb weniger Tage identifizierten Journalisten der „New York Times“ den Nutzer Nr. 4417749 mithilfe seiner Suchanfragen wie zum Beispiel „männliche Singles um die 60“, „Gesundheitstee“ und „Gartenbaufirmen in Lilburn, Ga“ als die 62 Jahre alte, verwitwete Thelma Arnold aus Lilburn im US-Bundesstaat Georgia. „Meine Güte, das ist mein ganzes Privatleben“, erzählte sie dem Reporter der „Times“. „Ich wusste ja nicht, dass mir die ganze Zeit jemand über die Schulter schaute.“ Der durch diese Berichterstattung ausgelöste Skandal kostete den Leiter der Technologieabteilung von AOL und zwei weitere Angestellte ihre Posten.

Und trotzdem unternahm nur zwei Monate später der Internet-Filmverleih Netflix etwas ganz Ähnliches, indem er den Netflix Prize ausschrieb, einen Wettbewerb für Software-Entwicklerteams. Ein Preisgeld von einer Million Dollar wartete auf das siegreiche Team, dem es gelang, das Filmempfehlungssystem von Netflix um mindestens zehn Prozent zu verbessern. Zum Testen stellte Netflix 100 Millionen Daten ausgeliehener Filme von fast einer halben Million Kunden zur Verfügung. Auch hier waren alle personenbezogenen Merkmale sorgfältig entfernt worden, und dennoch gelang es auch hier, einen Kunden zu identifizieren: eine Mutter aus dem konservativen Mittleren Westen der USA, die im Geheimen lesbisch war.

Forscher an der University of Texas in Austin hatten die Netflix-Daten mit anderen, öffentlich zugänglichen Informationen abgeglichen. Sie fanden schnell heraus, dass die Filmbewertungen eines der anonymisierten Netflix-Kunden genau mit denen einer namentlich genannten Rezensentin der Internet Movie Database (IMDb) übereinstimmten. Ganz allgemein zeigten die Forscher, dass sie einen Netflix-Kunden in 84 Prozent der Fälle schon anhand von Bewertungen von sechs weniger geläufigen Filme identifizieren konnten. War auch das Datum der Bewertungen bekannt, konnte der Kunde mit 99-prozentiger Wahrscheinlichkeit unter fast 500 000 Kunden in der Datenbank identifiziert werden.

Mit Daten gegen Stau und Krebs
Big Data gegen den Stau: Forscher arbeiten an Systemen, die Verkehrsdaten in Echtzeit auswerten. Ziel ist es, dank intelligenter Steuerung das tägliche Stop and Go auf den Autobahnen zu vermeiden. Die Informationen liefern Sensoren in den Autos und am Straßenrand. Ein Pilotprojekt läuft derzeit beispielsweise in der Rhein-Main-Region, allerdings nur mit rund 120 Autos. Langfristig ist sogar das vollautomatische Autofahren denkbar – der Computer übernimmt das Steuer. Quelle: dpa
Es waren nicht nur gute Wünsche, die US-Präsident Barack Obama zur Wiederwahl verholfen haben: Das Wahlkampf-Team des Demokraten wertete Informationen über die Wähler aus, um gerade Unentschlossene zu überzeugen. Dabei griffen die Helfer auch auf Soziale Netzwerke zurück. Quelle: dpa
Was sagen die Facebook-Freunde über die Bonität eines Nutzers aus? Das wollten die Auskunftei Schufa und das Hasso-Plattner-Institut in Potsdam im Sommer 2012 erforschen. Doch nach massiver Kritik beendeten sie ihr Projekt rasch wieder. Dabei wollten die beiden Organisationen lediglich auf öffentlich verfügbare Daten zugreifen. „Die Schufa darf nicht zum Big Brother des Wirtschaftslebens werden“, warnte etwa Verbraucherministerin Ilse Aigner ( CSU). Auch andere sind mit Big-Data-Projekten gescheitert. Quelle: dapd
Bewegungsdaten sind für die Werbewirtschaft Gold wert. Der Mobilfunk-Anbieter O2 wollte sie deswegen vermarkten und sich damit neue Einnahmequellen erschließen. Dafür gründete er Anfang Oktober die Tochtergesellschaft Telefónica Dynamic Insights. In Deutschland muss die Telefónica-Tochter allerdings auf dieses Geschäft verzichten: Der Handel mit über Handys gewonnenen Standortdaten sei grundsätzlich verboten, teilte die Bundesregierung mit. Quelle: AP
Welches Medikament wirkt am besten? Die Auswertung großer Datenmengen soll dabei helfen, für jeden Patienten eine individuelle Therapie zu entwickeln. So könnten die Mediziner eines Tages die Beschaffenheit von Tumoren genau analysieren und die Behandlung genau darauf zuschneiden. Quelle: dpa
Damit die Energiewende gelingt, müssen die Stromnetze intelligenter werden. Big-Data-Technologien können helfen, das stark schwankende Stromangebot von Windrädern und Solaranlagen zu managen. Quelle: dpa
Welche Geschenke interessieren welchen Kunden? Und welchen Preis würde er dafür zahlen? Der US-Einzelhändler Sears wertet große Datenmengen aus, um maßgeschneiderte Angebote samt individuell festgelegter Preise zu machen. Dabei fließen Informationen über registrierte Kunden ebenso ein wie die Preise von Konkurrenten und die Verfügbarkeit von Produkten. Die Berechnungen erledigt ein Big-Data-System auf der Grundlage von Hadoop-Technik, an dem der Konzern drei Jahre gearbeitet hat. Quelle: dapd

Im Fall von AOL enthüllte der Inhalt der Suchanfragen die Betreffenden, im Fall von Netflix war es ein Vergleich der Daten mit anderen Quellen. In beiden Fällen war den Unternehmen nicht bewusst, wie sehr Big Data die Re-Identifikation von Daten fördert.

Dafür gibt es zwei Gründe: Wir sammeln immer mehr Daten, und wir kombinieren immer mehr Daten. Paul Ohm, Juraprofessor an der University of Colorado in Boulder und Experte für den durch De-Anonymisierung ausgelösten Schaden, erklärt, dass man kaum etwas dagegen unternehmen kann: Wenn erst einmal genügend Daten zur Verfügung stehen, ist eine perfekte Anonymisierung auch bei großer Sorgfalt nicht mehr möglich. Schon heute fühlen daher viele Menschen sich in ihrer Privatsphäre verletzt. Wie wird das erst mit zunehmender Verbreitung der Big-Data-Methoden sein?

Im Vergleich zur DDR vor einem Vierteljahrhundert ist Überwachung heute leichter zu bewerkstelligen, billiger und umfassender. Das Aufzeichnen persönlicher Daten ist oft ein integraler Bestandteil der Dinge, die wir täglich benutzen, von Webseiten bis zu Smartphone-Apps. Natürlich: Wenn Unternehmen Daten sammeln, um mehr Geld zu verdienen, müssen wir nicht fürchten, dass dies die gleichen Konsequenzen hat, wie von der Stasi überwacht worden zu sein. Aber die Privatwirtschaft ist nicht der einzige Sektor, der sich mit Big Data vollsaugt. Auch die Behörden tun das.

Inhalt
Artikel auf einer Seite lesen

Jetzt auf wiwo.de

Sie wollen wissen, was die Wirtschaft bewegt? Hier geht es direkt zu den aktuellsten Beiträgen der WirtschaftsWoche.
Diesen Artikel teilen:
  • Artikel teilen per:
  • Artikel teilen per:
© Handelsblatt GmbH – Alle Rechte vorbehalten. Nutzungsrechte erwerben?
Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%