"Abstract Wikipedia": Enzyklopädie-Projekt für alle Sprachen

Die Wikipedia bekommt ein neues Schwesterprojekt. Statt Enzyklopädieartikel im Fließtext zu schreiben, sollen hier Fakten automatisiert zusammengefügt werden.

Lesezeit: 2 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 22 Beiträge
"Abstract Wikipedia" – Neues Enzyklopädie-Projekt für alle Sprachen

(Bild: Allmy/Shutterstock.com)

Von
  • Torsten Kleinz

Unter dem Projektnamen "Abstract Wikipedia" entsteht ein neues multi-linguales Schwesterprojekt der Wikipedia. Das Board of Trustees der Wikimedia Foundation hat das neue Projekt genehmigt, um die erheblichen Sprachbarrieren innerhalb der Online-Enzyklopädie einzureißen.

In den fast 20 Jahren ihres Bestehens funktionierte die Wikipedia ähnlich einer klassischen Enzyklopädie: Autoren entscheiden darüber, welches Wissen den Lesern Nutzen bringt und fangen an, Artikel nach dem Vorbild einer Enzyklopädie wie dem Brockhaus zu verfassen. Dabei revolutionierte die Online-Enzyklopädie das Konzept, wer als Enzyklopädie-Autor auf welche Weise beitragen kann: Jeder Internetnutzer kann ohne vorherige Anmeldung Artikel schreiben. Die Autoren und Administratoren kontrollieren gegenseitig die Einhaltung des teilweise byzantinisch anmutenden Regelwerks.

Zwar existieren zirka 300 verschiedene Sprachversionen der Wikipedia, doch nur ein Bruchteil davon deckt dabei einen Basis-Wissensschatz ab. Selbst wenn Artikel einmal erstellt werden, benötigen sie viel Pflege, um immer auf dem aktuellen Stand zu bleiben. Das erklärte Ziel der Wikipedia-Community, die "Summe allen Wissens" bereitzustellen, bleibt so immer in der Ferne.

Trotz mehrerer Anläufe hatte es die Wikimedia Foundation nicht geschafft, Wikipedia in Entwicklungsländern so populär zu machen, dass ein selbsttragendes Wachstum wie in Europa oder Amerika zu verzeichnen wäre. So musste die US-Stiftung Pläne aufgeben, internationale Büros zu gründen, um die Entwicklung lokaler Communities zu fördern. Auch der Ansatz Wikipedia von lokalen Mobilfunk-Providern kostenlos freischalten zu lassen um die Nutzung und damit auch die Artikelproduktion anzuheizen, erwies sich letztlich als nicht zielführend. Das Projekt wurde deshalb 2018 wieder eingestellt.

Die neue "Abstract Wikipedia" soll die Daten-Plattform Wikidata als Basis verwenden. Hier werden Fakten-Statements unabhängig von Sprache und Kontext zusammengetragen. Im Wikidata-Eintrag über Hannover sind unter anderem der genaue Standort, die politische Bedeutung im Laufe der Geschichte, das Stadtwappen, der offizielle Twitter-Acount der Stadtverwaltung und die ID-Codes für verschiedenste Bibliothekskataloge abgelegt. Damit können Wikidata-Nutzer nicht nur auf die lokal abgelegten Informationen zugreifen, sondern Abfragen an alle vernetzten Datenbanken gleichzeitig schicken.

Solche Daten-Statements können direkt aus externen Datenquellen importiert und damit automatisch aktuell gehalten werden. Auch sind Datenbanksuchen möglich, die neue Zusammenhänge aufzeigen – etwa eine Liste aller Bürgermeisterinnen deutscher Städte mit einem Alter unter 50 Jahren. Sogar Plattformen wie Google und Facebook greifen mittlerweile routinemäßig auf Wikidata zurück, um Kontextinformationen bereitzustellen.

Aus diesem Fakten-Sammelsurium sollen mit der neuen Abstract Wikipedia wieder lesbare und zugleich informative Artikel entstehen. Der Clou dabei: Mithilfe ausgefeilter Technik sollen diese gleichzeitig in verschiedenen Sprachversionen entstehen. Der Vorteil: Aktuelle Geschehnisse können zentral in allen Sprachversionen auf einmal eingepflegt werden.

Um dies umzusetzen, soll zunächst eine neue Sammlung von Sprach-Templates und Algorithmen entstehen, die Faktenzusammenhänge angemessen in einzelnen Sprachen wiedergeben. Hierzu wird ein Teil-Projekt namens "Wikilambda" gegründet, bei denen Freiwillige die entsprechenden Funktionen bereitstellen und austesten sollen. Dabei sollen nicht nur simple Statements wie "Hannover ist die Hauptstadt von Niedersachsen" entstehen, sondern die Kombination mehrerer Wikidata-Einträge sollen auch komplexe politische Winkelzüge in verständlicher Sprache geschildert werden.

Denny Vrandečić erklärt die Grundlagen von Wikidata und des neuen Projekts.

Die erfolgreiche Etablierung eines solchen Projekts ist auf die Unterstützung der Wikipedia-Community angewiesen. Trotz eines zweistelligen Millionen-Budgets hat die Wikimedia Foundation nicht die Ressourcen, ein solches Projekt alleine mit eigenen Angestellten zu stemmen. In den Wikipedia-Communities gibt es traditionell große Vorbehalte gegenüber automatisiert erstellten Inhalten, da der sprachliche Diskussionsprozess als wichtig zur Produktion von begreifbarem Wissen angesehen wird. Zugleich gibt es die Sorge, dass durch ein einheitliches Faktengerüst wichtige Standpunkte bei der Verarbeitung von Wissen verloren gehen. Gleichwohl werden Wikidata-Inhalte immer mehr in Wikipedia-Artikeln genutzt – etwa in Form von Faktenboxen.

Um das Projekt umzusetzen, wechselt Denny Vrandečić, der schon die Grundlagen von Wikidata geschaffen hatte, von Google zur Wikimedia Foundation. Hier soll er zunächst mit einem kleinen Team das neue Projekt anstoßen. Eine der ersten Aufgaben für die Community: Sie soll einen besseren Namen für die "Abstract Wikipedia" und die technische Plattform finden.

(mho)