Menü
iX Magazin

IANA veröffentlicht umfassende Liste für Sprachcodes

Von
vorlesen Drucken Kommentare lesen 23 Beiträge

Wer nach dem Kürzel einer Sprache sucht, muss nicht länger in mehreren ISO-Listen nach dem zwei-, drei- oder mehrbuchstabigen Code einer Sprache fahnden. Die Internet Assigned Numbers Authority (IANA) hat eine Zusammenstellung aller Kürzel (wie sie unter anderem für das (x)lang-Attribut in HTML- und XML-Dokumenten von Bedeutung sind) veröffentlicht.

Gleichzeitig haben A. Phillips (Yahoo) und M. Davis (Google) bei der Internet Engineering Task Force (IETF) mit dem RFC 4646 (Tags for Identifying Languages) beschrieben, wie man eine Sprache am besten mit einem Code bezeichnet. Der RFC löst die älteren RFCs 3066 und 1766 ab. Ausgehend von der IANA-Liste reicht es weiterhin oft, de, fr oder es zu schreiben. Mögliche Sprachecodes gliedern sich so:

Sprache-Schrift-Region-Variant-Erweiterung-Privates

Es besteht allerdings die Möglichkeit, nicht nur spezifische Regionen zu berücksichtigen (en-GB), sondern darüber hinaus optional die Schreibweise (Latn für lateinische Schrift) festzulegen und Varianten wie de-CH-1901 anzugeben, die schweizerisches Deutsch nach den Rechtschreibregeln von 1901 "meint". Idiolekte wie de-x-goethe sind ebenfalls erlaubt. Einen guten Überblick dazu gibt Richard Ishida in einer FAQ beim W3C. (hb)