Menü
Avatar von Bernd Paysan
  • Bernd Paysan

mehr als 1000 Beiträge seit 11.01.2000

Re: Ist eigentlich was das mich an Unicode stört...

Mr. B.B.C. schrieb am 13.03.2018 17:27:

die fehlende Systematik was Minuskel und Majuskel betrifft. Man muss förmlich für jeden Code sowohl extra ermitteln, ob es ein Majuskel oder Minuskel ist, als auch, welcher Code zu welchem gehört. Auf die Schnelle z.B. Bit 5 löschen/setzen/ignorieren ist da nicht. Daran krankt dann halt ggf. auch das DNS.

Das ist nur in einem relativ kleinen Bereich von Unicode überhaupt relevant (die meisten Schriften haben keine Minuskel und Majuskel, das ist ein Feature, das primär Latein, Griechisch und Kyrillisch betrifft). Es gibt noch eine Menge anderer Probleme beim Vergleich von Unicode-Strings miteinander. Bei Chinesisch gibt es traditionelle und vereinfachte Zeichen. Die hätte ich beim Unicode-Design übereinander gelegt, weil das eine Font-Frage ist, keine Zeichenencoding-Frage. Dann gibt es viele Möglichkeiten, Zeichen zu kombinieren, die es evtl. schon gleich als kombiniertes Zeichen gibt — alles eine reine Encoding-Hölle.

Bewerten
- +
Anzeige