Umlaute in R

Praxis & Tipps | Tipps & Tricks

Ich versuche, einen Datensatz mit dem Statistikprogramm R grafisch aufzubereiten, der Text mit deutschen Umlauten enthält. Leider gehen die beim Import kaputt, obwohl ich den Text mit UTF-8 gespeichert habe.

Dieses Problem kann man leicht ausräumen, aber je nach Betriebssystem unterscheidet sich die Vorgehensweise. Unter Linux und Mac OS X geben Sie nach dem Programmstart auf der Kommandozeile diesen Befehl ein:

Sys.setlocales("LC_ALL", "en_US.UTF-8")

Unter Windows sollte das prinzipiell zwar auch gehen, doch R quittiert diesen Befehl mit einer Fehlermeldung. Man kann sich aber behelfen, indem man das Encoding in der Quelldatei explizit über die Funktion read.table() angibt:

read.table("Quelle.csv", sep=",", fileEncoding="UTF-8")

Zusätzlich muss man für das Tabellenformat über den Parameter sep angeben, welches Zeichen die einzelnen Tabelleneinträge voneinander trennt – also etwa sep=“,“, wenn die Einträge kommasepariert sind. (pek)

Artikel kostenlos herunterladen

Infos zum Artikel

0Kommentare
Kommentieren
Kommentar verfassen
Anzeige

Anzeige

Anzeige