MapR integriert Spark- und Drill-Container in Kubernetes

Die MapR-Plattform erlaubt damit eine höhere Flexibilität durch die Trennung von Computing und Storage beim Einsatz von ML-Applikationen in Kubernetes.

03.04.2019, 13:25 Uhr

Lesezeit: 2 Min.

Developer

Von

Matthias Parbel

MapR Technologies bietet über die Data Fabric mit nativ integriertem Kubernetes Volume Driver bereits persistenten Speicher für Container, der den ortsunabhängigen Zugriff auf Dateien, Datenbanktabellen und Nachrichtenströme ermöglicht. Nun geht der Anbieter der Data Platform noch einen Schritt weiter, um die Skalierbarkeit und Verwaltung von cloud-nativen sowie Machine-Learning-Applikationen zu verbessern. MapR eröffnet Anwendern dazu auch die Möglichkeit, Apache-Spark- und Apache-Drill-Container als vorkonfigurierte Images in Kubernetes auszuführen.

MapR erweitert die Integration mit Kubernetes für eine stärkere Trennung von Compute und Storage

(Bild: MapR)

Erklärtes Ziel der angekündigten Neuerungen ist es, das Management von Anwendungen – insbesondere zustandsbehaftete und Microservices – von der Verwaltung der Storage-Ressourcen zu entkoppeln. Anwender sollen dadurch unter anderen in der Lage sein eine mandantenfähige Umgebung aufzubauen, die eine Isolierung von Ressourcen erlaubt, um Szenarien zu verhindern, in denen Anwendungen sich gegenseitig Ressourcen entziehen. "Das schließt auch das Deployment von Spark- und Drill-Container-Anwendungen mitsamt MapR-Volumes in Multicloud-Umgebungen einschließlich Private, Hybrid und Public Clouds ein", erklärt Suresh Ollala, Senior Vice President of Engineering bei MapR, im Rahmen eines Blogbeitrags zu den neuen Funktionen.

Die MapR-Integration mit den Kubernetes-Core-Komponenten (Operators, Namespaces etc.) schafft die Voraussetzungen, um verschiedene, isolierte Tenants mit individuellen Beschränkungen auf einer einzigen MapR-Plattform anzulegen. Anstatt einen dedizierten Cluster zu belegen, können beispielsweise Anwender mit dem regelmäßig wiederkehrendem Bedarf eine große Anzahl von Spark-Jobs abzuwickeln, die Compute-Jobs On-Demand über die vorkonfigurierten Container ausführen.

Die neuen Funktionen der MapR Data Platform sind derzeit nur im Rahmen einer Private Betatestphase verfügbar – sie sollen aber noch im Verlauf des zweiten Quartals allgemein zugänglich gemacht werden. Nähere Informationen zu den Neuerungen finden sich in der offiziellen Ankündigung sowie im Blogbeitrag. (map)