Mit der größten öffentlich zugänglichen Datenbank zum Wortschatz von Sprachen wollen Forschungsteams aus Deutschland und Neuseeland computergestützt bisher unsichtbare Strukturen finden. Die Sammlung heißt Lexibank, erläutert des Leipziger Max-Planck-Instituts für evolutionäre Anthropologie und nennt auch bereits Beispiele für Erkenntnisse, die sich daraus ziehen lassen.

So verwenden viele Sprachen überall auf dem Globus für "Mutter" und "Vater" Wörter, die den deutschen Begriffen "Mama" und "Papa" ähneln. Sprachen, die nur ein Wort für "Arm" und "Hand" kennen, bezeichnen meist auch "Bein" und "Fuß" mit dem gleichen Begriff. Mit computergestützten Methoden könne man so Fragen zur Evolution sprachlicher Evolution beantworten, erläutern sie.

Bisher unbekannte Muster gesucht

Lexibank enthält standardisierte Wortlisten für mehr als 2500 Sprachen beziehungsweise Sprachvarianten aus der ganzen Welt. Ziel war eine linguistische Datenbank auf Basis einheitlicher Datenformate. Das Ergebnis zeige jetzt nicht nur die Vorteile der Standardisierung, sondern werde solche und ähnliche Projekte weiter vorantreiben, ist man sich in Leipzig sicher.

Mit neu entwickelten computergestützten Arbeitsabläufen könne man die Datensätze vergleichen und Unterschiede sowie Gemeinsamkeiten von Sprachen ermitteln. In einem ersten Schritt habe man das für 60 verschiedene Merkmale durchgeführt. Die genannten Beispiele seien nur ein Anfang, und das Team erwartet, dass aus der Linguistik, Psychologie und Evolutionswissenschaft viele weitere Ansätze kommen.

Sprachen mit nur einem Wort für "Arm" und "Hand" (rot), beziehungsweise für "Fuß" und "Bein" (blau) (Bild: Mattis List et.al)

In der jetzt publizierten Vorstellung von Lexibank im Fachmagazin Scientific Data führen die daran beteiligten Forscher noch weitere Beispiele für bereits durchgeführte Analysen auf. So hat sich gezeigt, dass es vor allem in Südostasien Sprachen gibt, in denen die Begriffe für "Frau" und "Mann" auf eine gemeinsame Wurzel zurückgehen, bei "Junge" und "Mädchen" findet sich das Muster auch noch in Afrika und Südamerika. In Asien und Amerika teilen sich oft "Auge" und "Träne" die Wurzel, ind Südostasien außerdem "Träne" und "Wasser" – dort spricht man also vom "Augenwasser". Das Team hofft nun auf viele weitere derartige Analysen und eine Revolution des Wissens über sprachliche Vielfalt, ähnlich wie es Genomdatenbanken für die biologische Vielfalt getan hätten.

Lexibank ist Teil eines noch größeren Forschungsprojekts, in dem es noch Datenbanken zu Grammatiken, Lauten, linguistischen Weltbildern und Zahlwörtern gibt. Das Projekt läuft unter dem Namen Glottobank.

(mho)