R wie robust: Vor 20 Jahren erschien das erste Release der Programmiersprache R

Am 29. Februar 2000 wurde Version 1.0 von R aus der Taufe gehoben. Für die Auswertung von Big Data ist die Sprache zum etablierten Werkzeug geworden.

Lesezeit: 2 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 20 Beiträge
Von

Big Data ist schon geraume Zeit in aller Munde und wirtschaftlich elementar: Unternehmen beschäftigen "Data Scientists" und Analytiker, um aus dem anschwellenden Datenmeer tragfähige Schlüsse zu ziehen. Ein Kernelement hierfür ist die Programmiersprache R, deren erstes Release am 29. Februar 2000 in die Welt kam.

Damals hieß es: "Die Veröffentlichung der aktuellen Hauptversion zeigt, dass R unserer Meinung nach einen Grad an Stabilität und Reife erreicht hat, der es für den Produktionseinsatz geeignet macht. Die Veröffentlichung von 1.0.0 zeigt auch, dass die Basissprache und die API für Autoren von Erweiterungen auf absehbare Zeit stabil bleiben werden."

20 Jahre – ein stolzes Alter. Das Statistikwerkzeug ist aber auch mit 20 Jahren nicht etwa angestaubt, sondern höchst vital. Das liegt daran, dass R speziell für statistische Anwendungen mit Praxisbezug entworfen wurde. An R kommt heute niemand vorbei, der große Datenmengen auswertet. Da Machine Learning und KI stark im Kommen sind, steht neben Scala und Python auch R hoch im Kurs. Zeit für einen Rückblick!

R wurde bereits 1992 von Ross Ihaka und Robert Gentleman in Auckland als Alternative zu S entwickelt. Die Sprache ist besonders dazu geeignet, Daten statistisch auszuwerten und zu visualisieren. Als Open-Source-Software unterliegt sie der GNU-Lizenz, die in Wien ansässige "R Foundation for Statistical Computing" wacht über ihre Verbreitung.

Die größte Stärke von R liegt in der hohen Verfügbarkeit zahlreicher Packages, mit denen Zusatzfunktionen nach Bedarf ergänzt werden können. Inzwischen gibt es ein breites Spektrum solcher Packages für die unterschiedlichsten Szenarien und Einsatzzwecke: Hubs wie das Comprehensive R Archive Network (CRAN) stellen mittlerweile über 15.000 Zusatzpakete mit weit über 200.000 Funktionen kostenlos bereit. Für die allermeisten statistischen Probleme gibt es bereits vorgefertigte Lösungen, die Wissenschaftler und Entwickler zum direkten Einsatz herunterladen und ohne Aufwand implementieren können. Gibt es einmal keine Lösung für ein Nischenproblem, lässt R dank Open-Source-Lizenz unkompliziertes Nachjustieren für die eigenen Zwecke zu.

Ein Indikator für die ökonomische Relevanz von R sind die regelmäßig erscheinenden Indizes von PYPL, Tiobe und ähnlichen Anbietern, die die Nachfrage nach Programmierkenntnissen in Stellenausschreibungen für Softwareentwickler weltweit scannen: Damit verbunden sind oft auch höhere Gehälter für Entwickler, die die gefragtesten Sprachen beherrschen. R ist seit vielen Jahren in Programmiersprachen-Rankings konstant hoch platziert. Die Popularitätsspirale dürfte sich auch deshalb weiter nach oben drehen oder zumindest stabil halten, weil die hohe Nachfrage Softwarentwickler dazu anregt, sich neu oder weiter mit R zu beschäftigen.

Für die zunehmende Bedeutung von R spricht außerdem, dass Unternehmen wie Microsoft, SAP und Oracle in den letzten Jahren auf die Sprache aufmerksam geworden sind. So haben Microsoft für R-Unterstützung im SQL Server sowie SAP und Oracle in ihren Produkten HANA beziehungsweise Oracle-Datenbank und TimesTen gesorgt. Im zentralen Blog der R-Community zählte man kürzlich mehr als 128 Millionen Downloads, die über die Jahre zusammengekommen sind. Hier fällt des Weiteren die Diskrepanz zu 2017 auf, als man gerade mal 26,9 Millionen verzeichnete.

Aktuell ist derzeit die Version 3.6. Mit einem neuen Punktrelease ist aber wie immer in den vergangenen Jahren im Laufe des Frühjahrs zu rechnen.

Siehe dazu auf heise Developer:

(sih)