Verräterische Freunde

Wissenschaftler sagen, ein Profil einer Person aus deren Kontakten in einem Sozialen Netzwerk ableiten zu können

Es liegt auf der Hand, dass sich Rückschlüsse auf die Persönlichkeit eines Menschen machen lassen, wenn man dessen Freundinnen und Freunde kennt. Wer sich auf den Sozialen Netzwerken herumtreibt, vernetzt sich in der Regel mit seinen Freunden. Australische und amerikanische Wissenschaftler haben versucht, aus dem persönlichen Netzwerk von Twitter-Usern deren Aktivitäten und Interessen vorherzusagen. Angeblich reichen 8-9 Kontakte eines Menschen, um das mit einer Wahrscheinlichkeit von 95 Prozent machen zu können, ohne zuvor etwas von diesem selbst zu wissen.

Wissenschaftler und Behörden haben schon längst den Datenschatz erkannt, den die Sozialen Netzwerke auch ihnen übergeben. Da lässt sich dann die Ausbreitung von Epidemien ebenso wie von Memen oder Fake News nachvollziehen, Gerüchte oder Protestwellen lassen sich nachvollziehen, aber auch Netzwerke und eben Verhaltens- und Persönlichkeitsmerkmale des Einzelnen. Allerdings, so schreiben die Wissenschaftler in ihrer Studie, die in Nature Human Behaviour erschienen ist, sei die Quantifizierung des Informationsflusses schwierig. Die Komplexität der natürlichen Sprache sei ein Hindernis, aber auch die Quantifizierung und Objektivierung von Information. Die Verbindung des Inhalts von Kommunikation mit der genauen zeitlichen Aktivität, könne aber soziale Verbindungen besser erkennen lassen. Normalerweise würden die Menschen auch denken, dass sie auf Sozialen Netzwerken nur Informationen über sich preisgeben. Das sei aber falsch, sagt James Bagrow, einer der Autoren: "Das liegt nicht in der Hand einer Person: Sie geben auch Informationen über ihre Freunde preis." In den Kontakten spiegeln sich die Kommunikationspartner. Man könnte auch wie Lacan sagen: "Das Ich ist ein Anderer."

Die Wissenschaftler von der University of Adelaide und der University of Vermont untersuchten über 30 Millionen Twitter-Postings von mehr als 13000 Personen aus 927 "egozentrischen" Netzwerken mit den 15 am meisten genannten Kontakten. Daraus wurden Ego-Alter-Paare entwickelt, um den jeweiligen Informationsfluss auf der Grundlage der Informationstheorie zu messen und herauszufinden, wie viel Information über eine Person aus den Interaktionen mit engen Kontakten oder Freunden herauszufinden ist, oder eben, was sich aus den persönlichen Netzwerken über die Person mit maschinellem Lernen vorhersagen lässt. Als Kontrolle dienten zufällig zusammengestellte Paare, für die zeitliche Dimension wurde jedem echten Kontakt zufällig Postings zugeordnet, die zur selben Zeit dessen Postings entstanden sind. Die Genauigkeit des Programms könne man ähnlich prüfen wie bei der Auswertung von Texten, um vorherzusagen welche Worte eine Person auf der Grundlage von bereits geschriebenen Texten wahrscheinlich schreiben wird.

Auf Sozialen Netzwerken gibt es kein Versteck

Interessant ist, dass die Zahl der Kontakte - die meisten haben um die 100 Kontakte - eine Rolle für die Vorhersage einer Person spielt, allerdings so, dass sie dann, wenn die Kontakte mehr Verbindungen haben, die Vorhersage über ein Ego ungenauer machen, während wenige soziale Verbindungen der Kontakte bessere Erkenntnis ermöglichen. Das trifft wenig überraschend auch zu, wenn die Kommunikation seltener ist. Selbst wenn Ego, also die Person im Zentrum eines Netzwerks, einen Kontakt häufig erwähnt, heißt das nicht, dass der Kontakt auch mehr prädiktive Informationen über diesen liefert. Reziprozität erschließt mehr Informationen, sie ist ein Zeichen für die Nähe oder die Enge der persönlichen Beziehungen. Die Tendenz zur Bildung homophiler Netzwerke ist stark, was die Wissenschaftler aus der Entropie des Informationsflusses zwischen Paaren ableiten. Die Entropierate zwischen Ego und Alter eines Paares gleicht sich. Die Korrelation wird geringer, wenn die Distanz größer wird, bis zum fünftengsten Kontakt bleibt sie hoch.

Offensichtlich wollen die Wissenschaftler Betreibern von Sozialen Netzwerken Mittel in die Hand geben, um Nutzer besser zu profilieren und zu verfolgen und womöglich auch den Informationsfluss zu manipulieren. Man könne mit ihren Methoden im Prinzip aus den sozialen Verbindungen einer Person und den Aktivitäten der Kontakte "sogar genau die Personen profilieren, die in den Daten nicht auftauchen". Allerdings verändern sich Netzwerke und Personen mit der Zeit, was eine Vorhersage dann schwieriger macht, zumal wenn die Interaktion eingestellt wird oder ein User sogar seinen Account gelöscht hat (aber damit nicht die Daten, die dem Betreiber zur Verfügung stehen).

Lewis Mitchell, einer der Autoren, weist schon mal darauf hin, dass es auch nicht so viel nutzen würde, einen Account zu löschen, um seine Privatsphäre zu schützen, man könne sich auf Sozialen Netzwerken nicht verstecken: "Informationen zur Profilbildung etwa über die politischen Verbindungen oder Freizeitinteressen einer Person, lassen sich auch aus den Postings der Freunde bestimmen. Das ist so, wie wenn man einer Seite eines Telefongesprächs zuhört. Auch wenn man die Person am anderen Ende nicht hören kann, lässt sich viel an Informationen aus dem einseitigen Gespräch, das man hört, herausfinden."

Konkrete Beispiele für die aus Kontakten ableitbaren Informationen geben die Wissenschaftler nicht. Sie schreiben jedenfalls: "Unsere Ergebnisse haben unterschiedliche Datenschutzimplikationen: Informationen sind so stark in einem sozialen Netzwerk eingebettet, dass man im Prinzip ein Profil einer Person aus ihren vorhandenen sozialen Verbindungen herstellen kann, selbst wenn sie die Plattform gar nicht nutzt." Woher aber kennt man die sozialen Verbindungen einer Person in einem Sozialen Netzwerk, das diese vollständig vermeidet?

Our results have distinct privacy implications: information is so strongly embedded in a social network that, in principle, one can profile an individual from their available social ties even when the individual forgoes the platform completely. (Florian Rötzer)

Anzeige