Datenströme verarbeiten mit Apache Kafka

Das Messaging-System Apache Kafka kanalisiert Datenströme zwischen verschiedenen Systemen. Das Einsatzgebiet reicht von Data Handling bis Streaming-Szenarien.

Artikel verschenken
vorlesen Druckansicht 4 Kommentare lesen
Datenströme verarbeiten mit Apache Kafka
Lesezeit: 16 Min.
Von
  • Bernhard HopfenmĂĽller
  • Manuel Bonk
Inhaltsverzeichnis

Goldman Sachs, trivago, PayPal, Uber, Netflix und BMW sind darauf angewiesen, schnell Erkenntnisse aus groĂźen Datenmengen zu ziehen. Sie setzen dabei auf das Messaging-System Apache Kafka.

Systeme, die Streams verarbeiten, lassen sich nach Message Queues mit Punkt-zu-Punkt-Verbindungen und sogenannten Publish-Subscribe-Modellen unterscheiden. Die sendenden Systeme bezeichnet man als Producer, die Empfänger als Consumer.

Bei einer klassischen Message Queue fließen alle eingehenden Nachrichten in eine Warteschlange. Dort werden sie, sobald sie an der Reihe sind, abgearbeitet und verschwinden danach meist aus dem System. Dieser Ansatz lässt sich mit einer Warteschlange im realen Leben vergleichen.

Das war die Leseprobe unseres heise-Plus-Artikels "Datenströme verarbeiten mit Apache Kafka". Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.