Programmiersprache R 3.0 führt Lang-Vektoren ein
Nach rund achteinhalb Jahren erscheint eine neue größere Version der speziell für statistische Berechnungen und Graphen Softwareumgebung und Sprache, die außer den Lang-Vektoren auch parallele Prozesse unterstützt.
- Alexander Neumann
Die Programmiersprache R, die als Softwareumgebung speziell für statistische Berechnungen und Graphen ausgelegt ist, ist in Version 3.0 erschienen. Zentrale Neuerung der unter dem Codenamen Masked Marvel entwickelten Sprachversion, die den ersten Versionssprung seit achteinhalb Jahren darstellt, sind die Unterstützung für 64-Bit-Integer-Werte auf allen R-Plattformen. Für R 3.0 bedeutet das insbesondere die Einführung langer Vektoren mit mehr als 231 Elementen auf 64-Bit-Systemen. Die 64-Bit-Unterstützung ließ sich lange nur über Workarounds bewerkstelligen, ehe im Rahmen von Googles "Summer of Code"-Initiative Abhilfe geschaffen werden konnte.
Weitere Neuerungen sind die Unterstützung paralleler Prozesse und das Matrix-Paket, das eine Sammlung von Daten ermöglicht, die in einer zweidimensionalen rechteckigen Anordnung angeordnet sind. Darüber listet die Ankündigung rund 200 Posten zum Beispiel zu grundsätzlichen Änderungen, neuen Features, Performanceüberarbeitungen und Bugfixes auf.
R genießt unter Statistikern und Datenanalysten zunehmende Verbreitung, da die Sprache einfach zu erlernen ist, auch wenn keine Programmierkenntnisse vorliegen. Sie finden bei R eine Reihe Mechanismen für das Organisieren von Daten, zum Erstellen von Kalkulationen und zur optischen Aufbereitung der Datensätze. Auch gibt es rund 5000 als Erweiterung vorliegende Pakete für R, die sich speziellen Aufgaben widmen.
Die Sprache, die unter dem Dach des GNU-Projekts unter der GPL (General Public Licence) entwickelt wird, ist Anfang der 90er-Jahre aus der in den Bell Laboratories entwickelten Sprache S hervorgegangen, die sich gleicher Aufgaben annimmt. Viele für S geschriebene Programme sind auch unter R lauffähig. Die Sprache wurde in letzter Zeit dadurch geadelt, dass Unternehmen wie SAP und Oracle großen Wert darauf legten, sie in ihren Produkten HANA beziehungsweise Oracle-Datenbank und TimesTen zu unterstützen. R findet außerdem bei Google bei Datenanalysen Verwendung. (ane)