IBM kündigt Entwicklerplattform auf Basis von Apache Spark an
Die Data Science Experience ist eine Cloud-Plattform für Datenanalysten, die mit Python, R oder Scala Projekte entwickeln können.
Auf dem Spark Summit 2016 hat IBM eine Cloud-Plattform auf der Basis von Apache Spark angekündigt: Die Data Science Experience ist eine Entwicklerplattform in der Cloud, die vor allem Datenanalysten und Statistiker erreichen will und auf Bluemix verfügbar ist. Neben Open-Source-Werkzeugen und einer gemeinschaftlichen Arbeitsoberfläche bietet sie 250 kuratierte Datensätze.
Analysten können ihre Projekte mit R, Python oder Scala entwickeln. IBM bietet die Werkzeuge RStudio und Jupyter Notebook an. Als Datenplattform kommt das Big-Data-Framwork Apache Spark zum Einsatz. Es hat seine Wurzeln in einem Projekt des AMPLab der UC Berkeley aus dem Jahr 2009. 2014 wurde die Software ein Top-Level-Projekt der Apache Software Foundation. Mit Bibliotheken für Streaming-Szenarien und machinelles Lernen ist es für die Datenanalyse besonders gut geeignet. Die kommende Version 2.0, die derzeit als Alpha verfügbar ist, vereinheitlicht Batch-Daten und Datenströme.
Investitionen in Spark und R
Auf dem Spark Summit 2015 hatte IBM eine große Unterstützung für das auf In-Memory-Verarbeitung setzende Framework angekündigt und inzwischen laut eigenen Angaben 300 Millionen Dollar in Spark investiert. Im Oktober 2015 startete Big Blue ein SaaS-Angebot (Software as a Service) auf Bluemix auf Basis von Apache Spark.
Neuerdings ist IBM Platinmitglied des R Consortium, das Communites für die auf Datenanalyse zugeschnittene Programmiersprache R fördert. Seit der Einbindung von SparkR in das Big-Data-Framework im vergangenen Jahr kam R zusätzlich zu Java, Scala und Python zum Portfolio der über APIs in Apache Spark verwendbaren Programmiersprachen hinzu.
Derzeit befindet sich die Data Science Experience in einer Preview-Phase und bietet keine Dienste an. Interessierte können sich lediglich in eine Warteliste eintragen lassen. (rme)