Mit R in der Amazon-Cloud programmieren

Revolution R Enterprise wird nun auch als Amazon Web Service angeboten. R findet unter Statistikern und Datenanalysten zunehmend Verbreitung, da die funktionale Sprache einfach zu erlernen ist, auch wenn keine Programmierkenntnisse vorliegen

In Pocket speichern vorlesen Druckansicht 15 Kommentare lesen
Lesezeit: 2 Min.
Von
  • Alexander Neumann

Die Version 7 von Revolution R Enterprise, einer Softwaredistribution zur Arbeit mit der Programmiersprache R, wird nun auch über den Amazon Web Services Marketplace angeboten. Die Kopie der R-Distribution von Revolution Analytics lässt sich dadurch in Amazons Cloud-Umgebung als gehostete Version einsetzen. Revolution R Enterprise stellt eine kommerzielle Ausgabe von R zur Verfügung, bei der annähernd 50 der wichtigsten R-Pakete für spezielle Aufgaben angepasst wurden. Die Sprache selbst wird als GNU-Projekt unter der GPL (General Public Licence) entwickelt.

R findet unter Statistikern und Datenanalysten zunehmend Verbreitung, da die funktionale Sprache einfach zu erlernen ist, auch wenn keine Programmierkenntnisse vorliegen. Sie finden bei R Mechanismen für das Organisieren von Daten, zum Erstellen von Kalkulationen und zur optischen Aufbereitung der Datensätze.

Für den über sämtliche AWS-Regionen verfügbaren Service müssen Anwender auf stündlicher Basis 1,25 US-Dollar pro Prozessorkern zahlen. Zum Schnuppern gibt es eine über 14 Tage gültige Testversion. Das Cloud-Angebot läuft als VM-Image sowohl unter Windows als auch unter Linux und lässt sich zwischen zwei und 32 vCPUs (das "v steht für "virtual") skalieren. Auf die Windows-Version wird über Windows Remote Desktop zugegriffen, hier lässt sich auch Revolution Analytics' Entwicklungsumgebung DevelopR verwenden. Die Linux-Version integriert sich in den Browser und nutzt RStudio Server Pro als IDE.

Die analysierten Daten werden in Amazon Simple Storage Service (S3) und Amazon Relational Data Service (RDS) vorgehalten. Der Dienst kann Datensätze in der Größe bis zu einem Terabyte analysieren. Bei größeren Datenmengen empfiehlt es sich anscheinend, aus Kostengründen die lokale Version des R-Pakets zu nutzen.

Siehe dazu auf heise Developer:

(ane)