Programmiersprache R: Revolution R Enterprise 7 mit verbesserter Hadoop-Integration

Die Softwaredistribution zur Arbeit mit der Programmiersprache R integriert sich in Cloudera CDH3 und CDH4 sowie mit der Hortonworks Data Platform 1.3 und wurde an die Nutzung mit Teradata-Datenbanken angepasst.

In Pocket speichern vorlesen Druckansicht 5 Kommentare lesen
Lesezeit: 2 Min.
Von
  • Alexander Neumann

Revolution Analytics, Experte im Umgang mit der Programmiersprache R, hat die neue Version 7 seiner Softwaredistribution Revolution R Enterprise dahingehend ausgebaut, dass sie sich nun besser in Verbindung mit dem Big-Data-Framework Apache Hadoop nutzen lassen soll. Außerdem wurde das Softwarepaket so erweitert, dass sich R nun mit Teradata-Datenbanken nutzen lässt. Das neue Paket basiert auf der Version 3.0.2 von R.

RRE 7 enthält nun eine Bibliothek mit R-Algorithmen, die sich parallel über mehrere Hadoop-Knoten verwenden lassen, auf denen das Framework große Datensätze verarbeitet. Das neue Release von Revolution R Enterprise integriert sich hierfür mit den Hadoop-Distributionen von Cloudera, CDH3 und CDH4, sowie mit der Hortonworks Data Platform 1.3.

Darüber hinaus bietet RRE 7 eine Reihe neuer Algorithmen und Prozesse, darunter eine Sammlung von Modellen für die Einrichtung sogenannter Decision Forests, einer Machine-Learning-Technik für die Vorhersage zukünftiger Ergebnisse. Außerdem gibt es neue Möglichkeiten zur Visualisierung von Entscheidungsbäumen, durch die sich die Darstellung komplexer Zusammenhänge und Korrelationen innerhalb eines Satzes von Daten verbessert haben soll. Weitere Neuerungen listet der Artikel " What's New in Revolution R Enterprise 7" auf.

R ist unter Statistikern und Datenanalysten verbreitet, da die Sprache einfach zu erlernen ist, auch wenn keine Programmierkenntnisse vorliegen. Sie finden bei R Mechanismen für das Organisieren von Daten, zum Erstellen von Kalkulationen und zur optischen Aufbereitung der Datensätze. Die Sprache selbst wird unter dem Dach des GNU-Projekts unter der GPL (General Public Licence) entwickelt wird. R wurde in letzter Zeit dadurch geadelt, dass Unternehmen wie SAP und Oracle großen Wert darauf legten, sie in ihren Produkten HANA beziehungsweise Oracle-Datenbank und TimesTen zu unterstützen. Revolution Analytics geht von weltweit rund zwei Millionen Nutzern der Sprache aus.

Siehe dazu auch:

(ane)