Menü

Programmiersprache R ist in Version 3.6 erschienen

In der aktuellen Version der Statistiksprache gibt es einen neuen Serialisierungsformatstandard und eine kaum zu überblickende Zahl neuer Features.

Lesezeit: 1 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 6 Beiträge
Von

Schon seit Jahren erscheint Ende April ein neues Release von R. So auch dieses Jahr. Die Version 3.6 der Programmiersprache für statistische Berechnungen R umfasst mehrere Dutzend neue Features und viele weitere Änderungen bei der Paketinstallation, den sogenannten Utilities. Selbstverständlich hat es außerdem etliche Bugfixes gegeben, einigen Funktionen wurden hingegen als "deprecated" ("veraltet") markiert.

Das Serialisierungsformat in Version 3 wird zum Standard für die Serialisierung und Speicherung des Arbeitsbereichs (save(), serialize(), saveRDS(), compiler::cmpfile()). Serialisierte Daten im Format 3 können allerdings von R-Ausgaben älter als Version 3.5.0 nicht gelesen werden. Das Serialisierungsformat Version 2 lässt sich allerdings bei den Speicher-/Serialisierungsfunktionen weiterhin auswählen.

Die Standardmethode zum Erzeugen aus einer diskreten Gleichverteilung (z. B. bei sample()) wurde geändert. Damit tragen die Entwickler der Beobachtung Rechnung, dass die bisherige Methode sample() bei großen Populationen deutlich uneinheitlich gemacht hat. Die vorherige Methode lässt sich auch weiterhin mit RNGkind() oder RNGversion() aufrufen, wenn das für die Reproduktion alter Ergebnisse erforderlich ist.

Unter den neuen Features werden zuerst genannt, dass die Sys.setFileTime()-Funktion vektorisiert wurde, sodass die Argumente path und time der Länge größer als eins nun unterstützt werden, und dass axis() die neue Option gap.axis = NA zur Angabe eines Multiplikationsfaktors für den minimalen Abstand zwischen den gezeichneten Achsenbeschriftungen bekommen hat. removeSource() lässt sich nun nicht nur bei Funktionen einsetzen, sondern auch bei einigen Sprachobjekten.

Darüber hinaus gibt es die neue Funktion nullfile(), mit der sich Dateinamen des Nullsystem-Gerätes (z. B. /dev/null) auf der aktuellen Plattform angeben lassen. Es gibt mit keep.parse.data und keep.parse.data.pkgs außerdem zwei neue Optionen, die steuern, ob Parse-Daten in Quellen aufgenommen werden, wenn keep.source oder keep.source.pkgs "TRUE" ist.

Weitere Änderungen sind mannigfaltig, weswegen zuvor auf nur einige wenige eingegangen wurde. Sämtliche Änderungen lassen sich der Ankündigung entnehmen, den Sourcecode gibt es über ein tar.gz-Paket.

R entstand in den 90er-Jahren mit einem klaren Fokus auf statistische Berechnungen und Darstellung. Die Funktionen konzentrieren sich auf die Organisation der Daten und deren optische Aufbereitung. Das ist der Hauptgrund dafür, dass sie bei Statistikern einen guten Ruf hat. Außerdem ist sie dadurch gut geeignet für den Einsatz in Szenarien des maschinellen Lernens.

Siehe dazu auf heise Developer:

(ane)