Menü

OkCupid: Wissenschaftler veröffentlichen 70.000 volle Datensätze von Dating-Seite

Dänische Forscher haben persönliche Daten aus zehntausenden Nutzerprofilen der Dating-Seite OkCupid automatisiert abgegriffen und in das Open Science Framework geladen. Die Profile enthalten keine Realnamen, aber jede Menge intime Details.

Lesezeit: 1 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 118 Beiträge

Komplette Anonymität ist bei Dating-Portalen nicht sinnvoll, doch die öffentlich zugängliche Daten wecken Begehrlichkeiten.

(Bild: dpa, Stephan Jansen)

Von

Mehrere Wissenschaftler haben systematisch Profile der Dating-Plattform OkCupid abgegriffen und die gesammelten Daten auf eine frei zugängliche Plattform für wissenschaftliche Daten gestellt, berichtet das Magazin Vox. Zwar wurden Realnamen und Profilbilder nicht hochgeladen, doch die Datensätze enthalten neben dem Nutzernamen zahlreiche Informationen, mit denen sich die jeweiligen Nutzer identifizieren ließen. Für ihr Profil beantworten die Nutzer oft Hunderte Fragen, darunter auch Angaben zu Religion, Politik und sexuellen Vorlieben, die die Begehrlichkeiten der drei dänischen Sozialforscher weckten.

Die zwar grundsätzlich öffentlichen, aber nur angemeldeten OkCupid-Nutzern zugänglichen Daten wurden mithilfe eines Scrapers automatisiert gesammelt. Anschließend wurden die Daten in das Open Science Framework (OFS) geladen, das Wissenschaftlern erlaubt, gesammelte Rohdaten und Projekte anderen Nutzern für die eigene Forschung zur Verfügung zu stellen.

Vox weist in seinem Bericht darauf hin, dass die Sammlung mindestens ethisch problematisch sei. So wurden weder die OkCupid-Nutzer, noch die Plattform selbst über die Vorgänge informiert. Einer der beteiligten Forscher, Emil Kirkegaard, weist zwar ausdrücklich darauf hin, dass die Daten ohnehin öffentlich gewesen seien. Die betroffen Nutzer haben allerdings keine Möglichkeit zu kontrollieren, was mit ihren Daten weiter geschieht. Warum die Nutzernamen zusammen mit den Daten veröffentlicht wurden, begründet Kirkegaard damit, dass man Informationen wie die Größe zunächst nicht gesammelt habe, diese so aber nachträglich verknüpfen könne.

Die Universität von Aarhus, an der die drei Beteiligten arbeiten, hat sich von der Aktion distanziert. Über Twitter betont das Institut, dass Emil Kirkegaard zwar Student an der Universität sei, aber nicht in ihrem Namen handle und auch keine Unterstützung für das Projekt erhalte. Auch Kirkegaard spricht von einer privaten Initiative.

So oder so zeigt sie jedoch, wie einfach sich größere Mengen an persönlichen Daten unbemerkt abgreifen lassen. Über 500 mal wurden die Rohdaten bereits heruntergeladen, nachdem der Link auf Reddit verbreitet wurde. Mittlerweile sind die Daten beim OFS mit Hinweis auf rechtliche Probleme gesperrt. OkCupid hatte zuvor bereits angekündigt wegen Verletzung der Nutzungsbedingungen gegen die Veröffentlichung der Daten vorzugehen. Die Plattform wertete über mehrere Jahre ebenfalls solche Daten aus und veröffentliche sie anonymisiert im eigenen Blog.

Wie problematisch persönliche Daten auf Dating-Plattformen sein können und wie einfach sie die Identifikation und das Auffinden der realen Person machen, behandelt die aktuelle c't 11/16 am Beispiel von Tinder:

(asp)