Facebook liefert Forschern riesigen fehlerhaften Datenschatz

2020 hat das soziale Netzwerk dem Wissenschaftsprojekt Social Science One etwa 1 Exabyte Daten übergeben. Diese seien nicht vollständig, heißt es in US-Medien.

Lesezeit: 2 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 21 Beiträge

(Bild: NajiHabib)

Von
  • Andreas Wilkens

Facebook hat einem Wissenschaftsprojekt für Forschungszwecke einen großen Vorrat anonymisierter Daten übergeben, der nicht wie erwartet vollständig war. Das könnte Einfluss auf eine noch unbekannte Zahl von wissenschaftlichen Arbeiten über den Einfluss sozialer Medien auf demokratische Wahlen haben, berichten US-Medien.

Der etwa 1 Exabyte große Datensatz sollte Informationen zu etwa 38 Millionen URLs enthalten, die Facebook-Nutzer zwischen Januar 2017 und Juli 2019 öffentlich jeweils mindestens hundertmal auf der Plattform teilten. Das Projekt hatte die Daten 2020 von Facebook bekommen.

Von dem Fehler betroffen könnten die wissenschaftlichen Arbeiten von gut 100 Forschenden sein, die dem 2018 gegründeten Konsortium Social Science One angeschlossen sind. Facebook habe sich für die fehlerhaften Daten entschuldigt, berichtet die Washington Post.

Facebook soll aufgrund eines technischen Fehlers aus dem Datensatz von US-Mitgliedern seines sozialen Netzwerks jene ausgeschlossen haben, die keine nachweisbaren politischen Neigungen haben. Das ist etwa die Hälfte der Facebook-Accounts in den USA. Accounts aus anderen Ländern sollen nicht betroffen sein.

Der italienische Internetforscher Fabio Giglietto von der Universität Urbino soll laut New York Times in dem Datensatz Anomalien entdeckt und Facebook darauf aufmerksam gemacht haben. Laut Harvard-Professor Gary King, der Social Science One mitinitiierte, sollen Dutzende Arbeiten von dem Problem betroffen sein. Das Ausmaß und die Konsequenzen könnten erst ausgemacht werden, wenn Facebook einen korrekten Datensatz liefert, doch das kann noch Wochen dauern.

Es soll einer der größten Datensätze sein, den es in der Geschichte der Sozialwissenschaften je gegeben hat. Dabei sollen Vorkehrungen getroffen worden sein, dass die einzelnen Facebook-Nutzer nicht anhand der Posts identifiziert werden können. (anw)