Hadoop-Cluster in der Cloud und on Premises

Für die Verarbeitung großer Datenmengen eignet sich das Hadoop-Ökosystem. Ein unabhängiger Provisionierungsmechanismus erhöht die Flexibilität im Cloud-Einsatz.

Artikel verschenken

04.07.2019, 16:20 Uhr

Lesezeit: 12 Min.

iX Magazin

Von

Thomas Mager
Frank Feller
Silvia Fademrecht

Hadoop-Cluster in der Cloud und on Premises
- Clusterkonfiguration vereinheitlichen
Der Weg zur Cluster-Provisionierung
Langlebige versus kurzlebige Cluster

Artikel in iX 7/2019 lesen

Neue Geschäftsfelder wie das Internet der Dinge erfordern zunehmend den Umgang mit großen Datenmengen, beispielsweise für die Speicherung und Verarbeitung erfasster Sensordaten. Eine breite Datenbasis unterstützt zudem viele Optimierungsszenarien, so im Zusammenhang mit präventiver Wartung, Kundensegmentanalyse, Betrugserkennung, Produktions- und Qualitätsoptimierung.

Das Big-Data-Ökosystem Hadoop hat sich aufgrund seiner Offenheit als Apache-Projekt und seiner Vielzahl an Tools als De-facto-Standard zur skalierbaren Verarbeitung solch großer Datenmengen durchgesetzt. Längst bieten auch Cloud-Provider wie Amazon Web Services (AWS), Google Cloud Platform (GCP) und Microsoft Azure native Hadoop-Funktionalität in ihren Cloud-Umgebungen an, um Anwendungen zur Datenverarbeitung zu entwickeln. Die Ansteuerung der angebotenen Services erfolgt über Cloud-spezifische Schnittstellen, wodurch die Nutzung eine Anpassung an die jeweils gewählte Cloud-Plattform erfordert. Es liegt jedoch nicht im Interesse des Nutzers, seine Anwendung auf eine spezifische Cloud-Plattform zuzuschneiden, da das einen Wechsel des Cloud-Providers durch erhöhte Wechselkosten (Vendor Lock-in) erschwert.

Setzt ein Unternehmen für die Datenspeicherung auf einen Cloud-Provider, bietet es sich an, die Algorithmen zur Datenverarbeitung auch physikalisch nah zu diesen Daten zu bringen. So kann das Unternehmen die Auswirkungen von Netzwerklatenzen und Bandbreiteneinschränkungen minimieren. Im Idealfall befindet sich beides im gleichen Rechenzentrum des Cloud-Providers. Der Effekt, dass bestehende Daten – relativ zur Datenmenge – mehr und mehr Software, Services und Geschäftslogik in ihre physikalische Nähe ziehen, wird im Big-Data-Kontext als Data Gravity bezeichnet.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Auf Kante genäht: Was hinter dem Aus von Apple-Händler Gravis steckt

Aus vagen Gerüchten wurde bittere Wahrheit. Gravis, einer der führenden Apple-Reseller Deutschlands, gibt auf. Wir erklären die Hintergründe.

Krise in der Spielebranche: Entlassungen, Schließungen und zerstörte Karrieren

Zehntausende Menschen haben allein seit 2022 ihren Job in der Spielebranche verloren. Wir haben nach den Ursachen des globalen Phänomens gesucht.

Kostenlos hochwertige KI-Musik erzeugen: Das leisten Suno und Udio

So erstellen Sie mit Suno oder Udio verblüffend gute KI-Musik, von persönlichen Grüßen bis zu ganzen Partysongs.

Smart-Home-Zentralen im Vergleich: Amazons Echo Hub gegen Home Assistant

Wir zeigen, welche Smart-Home-Lösung sich für wen lohnt: Amazons Echo Hub für 200 Euro oder die kostenlose Smart-Home-Software Home Assistant.

Innovative,Ai,Robot,Tutor,Helping,A,Teenage,Boy,With,Homework,

Fremdsprachen lernen: Wie man ChatGPT zum Sprechtrainer aufrüstet

Sie möchten mit einem KI-Sprechtrainer eine Fremdsprache üben, dafür aber kein Abo abschließen? ChatGPT macht es möglich – sogar in der kostenlosen Version.

ChatGPT optimieren

Ausprobiert: Fritzbox als NAS-Ersatz verwenden

AVM bietet mit FritzNAS die Option, die Fritzbox zum Netzwerkspeicher zu machen. Wir prüfen, wie sich die Kombi im Vergleich zu herkömmlichen NAS schlägt.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Auf Kante genäht: Was hinter dem Aus von Apple-Händler Gravis steckt

Aus vagen Gerüchten wurde bittere Wahrheit. Gravis, einer der führenden Apple-Reseller Deutschlands, gibt auf. Wir erklären die Hintergründe.

Krise in der Spielebranche: Entlassungen, Schließungen und zerstörte Karrieren

Zehntausende Menschen haben allein seit 2022 ihren Job in der Spielebranche verloren. Wir haben nach den Ursachen des globalen Phänomens gesucht.

Kostenlos hochwertige KI-Musik erzeugen: Das leisten Suno und Udio

So erstellen Sie mit Suno oder Udio verblüffend gute KI-Musik, von persönlichen Grüßen bis zu ganzen Partysongs.

Smart-Home-Zentralen im Vergleich: Amazons Echo Hub gegen Home Assistant

Wir zeigen, welche Smart-Home-Lösung sich für wen lohnt: Amazons Echo Hub für 200 Euro oder die kostenlose Smart-Home-Software Home Assistant.

Fremdsprachen lernen: Wie man ChatGPT zum Sprechtrainer aufrüstet

Sie möchten mit einem KI-Sprechtrainer eine Fremdsprache üben, dafür aber kein Abo abschließen? ChatGPT macht es möglich – sogar in der kostenlosen Version.

ChatGPT optimieren

Ausprobiert: Fritzbox als NAS-Ersatz verwenden

AVM bietet mit FritzNAS die Option, die Fritzbox zum Netzwerkspeicher zu machen. Wir prüfen, wie sich die Kombi im Vergleich zu herkömmlichen NAS schlägt.

nach oben

Alle Angebote

Newsletter heise-Bot Push Push-Nachrichten

${intro} ${title}

${intro} ${title}

Hadoop-Cluster in der Cloud und on Premises

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Auf Kante genäht: Was hinter dem Aus von Apple-Händler Gravis steckt

Krise in der Spielebranche: Entlassungen, Schließungen und zerstörte Karrieren

Kostenlos hochwertige KI-Musik erzeugen: Das leisten Suno und Udio

Smart-Home-Zentralen im Vergleich: Amazons Echo Hub gegen Home Assistant

Fremdsprachen lernen: Wie man ChatGPT zum Sprechtrainer aufrüstet

Ausprobiert: Fritzbox als NAS-Ersatz verwenden

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Auf Kante genäht: Was hinter dem Aus von Apple-Händler Gravis steckt

Krise in der Spielebranche: Entlassungen, Schließungen und zerstörte Karrieren

Kostenlos hochwertige KI-Musik erzeugen: Das leisten Suno und Udio

Smart-Home-Zentralen im Vergleich: Amazons Echo Hub gegen Home Assistant

Fremdsprachen lernen: Wie man ChatGPT zum Sprechtrainer aufrüstet

Ausprobiert: Fritzbox als NAS-Ersatz verwenden

Spiele

1 Jahr nur 1,90 € pro Woche

Das digitale Abo für IT und Technik.