25 Jahre: Wie R zur wichtigsten Programmiersprache für Statistiker wurde

Seite 2: Schnell wachsender Zuspruch

Inhaltsverzeichnis

Dies verdeutlicht, wie schnell R angenommen wurde. Hierbei half sicherlich, dass die Sprache im Gegensatz zu S, SAS und SPSS als freie Sprache angeboten wurde, die ab 1995 mit der GNU GPL als Open-Source-Software lizenziert wurde – R ist Teil des GNU-Projekts. Auch bildete sich schon bald ein Kernentwicklerteam, das von 1997 an als sogenanntes R Development Core Team (R Core Team) fungierte. Ebenfalls 1997 markierte die Einrichtung des Comprehensive R Archive Network (CRAN) den nächsten wichtigen Schritt zur Förderung der Sprache. Es bis heute die wichtigste Ressource für Informationen und zum Herunterladen von R-Paketen. Die meisten Funktionen von R sind in den in CRAN gespeicherten Paketen enthalten, die sich bei Bedarf laden und verwenden lassen. Spätestens hier konnte R gegenüber anderer statistischer Software punkten.

Die Sprache selbst bietet unter anderem die Möglichkeit, Daten zu laden, zu exportieren und zu transformieren, auf Wahrscheinlichkeitsverteilungen und mathematische Funktionen zuzugreifen, lineare Modelle für Daten zu erstellen und Ergebnisse visuell ansprechend darzustellen. Sie bietet darüber hinaus eine Syntax, um weitere Werkzeuge zu erstellen, wodurch sich mit R die einzelnen Funktionen miteinander verknüpfen lassen. Viel Zeit spart man aber letztlich dabei, dass man, statt viele neue Codezeilen schreiben zu müssen, über das CRAN die Arbeit anderer herunterladen und nutzen kann.

Mehr Infos

R auf der data2day

Die Programmiersprache R spielt auch auf der von heise Developer mitbetriebenen Big-Data-Konferenz data2day 2018 eine Rolle. So wird es zum gegenwärtigen Zeitpunkt mindestens den Einführungs-Workshop "Data Science mit R" und die Session "Dash & Shiny – Dashboards mit Python und R" geben. Zum Programm der data2day 2018 geht es hier.

Der Erfolg des Netzwerks lässt sich auch an Zahlen ablesen. Das Archiv enthält mittlerweile mehr als 12.000 Pakete und wächst weiterhin schnell. Von Januar bis Mai 2018 wurden durchschnittlich 21 Pakete pro Tag hinzugefügt oder aktualisiert. Die zu überprüfen und zu überwachen ist keine einfache Aufgabe und kostet viel Zeit – gerade auch, wenn Pakete abgelehnt werden. Ebenfalls wichtig und auch ein Ausdruck des Erfolgs ist es, dass sich auf die Funktionen von R mittlerweile aus vielen anderen Sprachen zugreifen lässt und dass die meiste Software mit Schwerpunkt auf Statistik Integrationen mit R bietet.

Am 29. Februar 2000 erschien die als stabil betrachtete Version 1.0. Version 2.0 folgte im Herbst 2004 mit Features wie Lazy Loading, um Daten schneller laden zu können. Weitere Funktionen der folgenden Sprachversionen sind Internationalisierung und Zeichenkodierungen, die Nutzung auf 64-Bit-Systemen, die Kompilierung zu Bytecode, ein Just-In-Time-Compiler und Nebenläufigkeit für parallele Ausführung von Funktionen. 2013 erschien dann Version 3.0, und seit diesem Frühjahr ist R 3.5.x aktuell.

Die gemeinnützige in Österreich beheimatete R Foundation for Statistical Computing verwaltet Urheberrecht und Dokumentation von R. Zudem kümmert sie sich um die Kommunikation mit der Presse und interessierten Organisationen. Mehrere größere Unternehmen, die R einsetzen oder gar ihr Geschäftsmodell darauf abstützen, gründeten 2015 das R Consortium. Es wird im Rahmen der Linux Foundation betrieben. Zu den Aufgaben des R-Konsortiums gehören einerseits, die R Foundation bei der Weiterentwicklung, Wartung und Verteilung von R-Software zu unterstützen, und andererseits, ein einheitliches Rahmenwerk für die R-Anwender bereitzustellen. Die Organisation wird dabei durch Beiträge ihrer Mitglieder finanziert.

Siehe dazu auf heise Developer:

(ane)