Mit Wikipedia Epidemien voraussagen

Was Google kann, kann Wikipedia noch besser: Ausbrüche von Krankheiten vorhersagen, bevor diese in den offiziellen Statistiken auftauchen

Seit 2008 bietet Google mit den FluTrends einen Dienst, der die Ausbreitung von Grippe-Epidemien weltweit prognostiziert. Inzwischen wurde FluTrends von DengueTrends ergänzt, die sich um das Denguefieber kümmern. Mit ähnlichen Projekten haben FluTrends & Co. eines gemeinsam: Forscher nutzen Internet-Datenquellen wie etwa Suchanfragen oder Postings in sozialen Medien, um mit Methoden der Big-Data-Analyse den dahinter stehenden Trends auf die Schliche zu kommen.

Das funktioniert überraschend gut - und ist vor allem in den Ländern nützlich, in denen die traditionellen Kanäle des Gesundheitswesens weniger ausgebaut sind. Doch selbst in Ländern wie den USA hinken die amtlichen Meldesysteme den Internet-Daten um ein paar Tage hinterher. Damit solche Prognose-Verfahren zur Entscheidungsfindung taugen, sind allerdings ein paar Voraussetzungen sicherzustellen.

So sollten sowohl die verwendeten Modelle als auch die zugrundeliegenden Daten offen zur Verfügung stehen. Die Verfahren sollten einfach und kostengünstig auf andere Krankheiten und andere Länder übertragbar sein. Dabei sollten sie auch mit alternativen Trainings-Daten zurechtkommen, wenn etwa offizielle Verlaufsdaten nicht zur Verfügung stehen. Und schließlich müssen Daten und Algorithmen auch eine Vorhersage mit akzeptabler Sicherheit zulassen.

All diese Voraussetzungen sind bei einem Verfahren gegeben, das Forscher jetzt im Fachmagazin PLoS Computational Biology vorstellen. Die Wissenschaftler des Los Alamos National Laboratory nutzen Aufrufzahlen der Wikipedia für ihre Analyse. Ihre Algorithmen stellen die Forscher kostenlos hier zur Verfügung.

In ihrem Paper zeigen sie, dass sich anhand der Zugangsstatistiken von Wikipedia-Artikeln wirksame Vorhersagen treffen lassen - wobei derzeit allein die Sprache zur räumlichen Zuordnung zur Verfügung steht. Zudem testen die Forscher das Verfahren auf die oben erwähnten Voraussetzungen und vergleichen dabei auch mit konkurrierenden Analysen. Das Paper selbst steht ebenfalls offen zur Lektüre. (Matthias Gräbner)

Anzeige