Menü

Wikipedia: 10 Milliarden Abrufe pro Monat

Von
vorlesen Drucken Kommentare lesen 167 Beiträge

Wikipedia-Statistiker Erik Zachte hat für die neue Übersicht die Logfiles der Proxy-Server der Wikimedia-Foundation ausgewertet. Demnach haben Wikipedia-Leser alleine im September 10,175 Milliarden Seiten abgerufen. Die Schwersterprojekte kamen im selben Monat immerhin auf 456 Millionen Abrufe.

Wenig überraschend: Die englischsprachigen Wikis dominieren die Statistik. Mehr als 5,4 Milliarden Seitenabrufe landeten bei der englischen Wikipedia. Kein Wunder: Mit über 2,5 Millionen Artikeln ist sie auch das größte Projekt der Wikimedia Foundation. Auf Platz 2 landet die japanische Ausgabe mit 998 Millionen Abrufen. Die deutsche Ausgabe kommt mit 818 Millionen, obwohl sie fast 30.000 Artikel mehr enthält als die japanische Ausgabe. Bei den anderen Projekten der Wikimedia Foundation liegt das Multimedia-Archiv Wikimedia Commons mit 173 Millionen Abrufen vorne, das kollaborative Wörterbuch Wikitionary kommt auf 151 Millionen Abrufe.

Die zugrunde liegenden Rohdaten sind über den Server von Wikimedia-Vorstand Domas Mituzas abrufbar. Wer die Zahlen verarbeiten will, braucht viel Speicherplatz. Die Log-Files einer einzigen Stunde verbrauchen in aggregierter und komprimierter Form um die 50 Megabyte. Nicht enthalten sind die Aufrufe registrierter Benutzer, deren Edits an den Proxy-Servern in der Regel vorbei geschleust werden. Dennoch sind die Zahlen tendenziell etwas zu hoch, da auch die Abrufe automatischer Skripte in die Statistik einfließen. So kommt zum Beispiel die Wikipedia-Ausgabe in der afrikanischen Sprache Herero im September immer noch auf 5700 Abrufe, obwohl das Projekt vor über einem Jahr eingestellt wurde.

Wer etwas mehr in die Tiefe der Statistik einsteigen will, findet bei THEwikiStics ausführlichere Auswertungen. Hier kann man für jeden einzelnen Artikel detaillierte Statistiken der letzten Monate abrufen, inklusive einer Top-Liste der am häufigsten gesuchten Artikel. Noch detaillierter sind die Wikipedia article traffic statistics, die für jeden einzelnen Artikel eine tägliche Nutzungsstatistik ausgeben. So wurde zum Beispiel der Artikel über den österreichischen Politiker Jörg Haider an dessen Todestag über 235.000 Mal gelesen. Doch nicht nur schlagzeilenträchtige Themen sorgen für Wissensdurst: So schlugen über 240.000 Leser am dritten Oktober nach, was es mit dem Tag der deutschen Einheit auf sich hat.

Eine andere Anwendung der Daten hat der in der Wikipedia-Community unbeliebte Gregory Kohs gefunden: Er veröffentlichte eine Studie mit Vandalismen der Wikipedia-Artikel von US-Politikern. Mithilfe der Nutzungsstatistiken rechnete er hoch, wie viele Leser die falschen Informationen in den Artikeln zu sehen bekamen, bevor sie wieder korrigiert wurden. Nach seiner Berechnung waren zu 6,8 Prozent des gesichteten Zeitraums wissentlich eingeschleuste Falschinformationen zu lesen – meist handelt es sich allerdings um offensichtliche Vandalismen oder nebensächliche Informationen.

Um diese Datenmengen zu bewegen, betreibt die Wikimedia Foundation derzeit über 400 Server, die in drei Rechenzentren verteilt sind. Um den Verwaltungsaufwand zu reduzieren, hat Wikimedia unter Chef-Techniker Brion Vibber nun den Serverpark komplett auf Ubuntu Linux 8.04 migriert. Vorher kamen auf den Rechnern auch Red Hat und verschiedene Versionen von Fedora Linux zum Einsatz. (Torsten Kleinz) / (jk)

Anzeige
Anzeige