Datenbankarchitektur: Apache ShardingSphere steigt auf zum Top-Level-Projekt

Die Middleware erlaubt verteiltes Speichern von Big Data bei weiterhin relationalem Zugriff – das Ökosystem ShardingSphere ist nun bei Apache Top-Level-Projekt.

1

21.04.2020, 15:19 Uhr

Lesezeit: 3 Min.

Developer

Von

Silke Hahn

Datenbankarchitektur: Apache ShardingSphere steigt auf zum Top-Level-Projekt

Die Apache Software Foundation hat Apache ShardingSphere, ein verteiltes Middleware-Ökosystem für Big Data, zum Top-Level-Projekt hochgestuft. Die Middleware erlaubt es Anwendungen, klassische Zugriffsmethoden weiterhin zu nutzen, während im Hintergrund ein verteiltes Szenario die Rechen- und Speicherfähigkeiten mehrerer relationaler Datenbanken ausschöpft.

Gewachsenes Ökosystem von Apache ShardingSphere

ShardingSphere kam Ende 2018 als Java-Database-Connectivity-Treiber (JDBC) in den Apache Incubator, seither hat es an Funktionalität hinzugewonnen.

Das Projekt besteht inzwischen aus drei Unterprojekten: Einem Java-Framework, das zusätzliche Dienste auf der Java-JDBC-Schicht bietet und Ausgangspunkt der Entwicklung war, einem Datenbank-Proxy (ShardingSphere Proxy) und einem Sidecar als Cloud-nativem Agenten für die Kubernetes-Umgebung, der den Zugang zur Datenbank steuert (ShardingSphere Sidecar). Sidecars stellen der Datenbank eine interagierende Netzebene bereit, über die sich Zugriffe zentral steuern lassen.

Skizze des Ökosystems von Apache ShardingSphere, einer auf Java basierenden Middleware für Big Data — Ökosystem von Apache ShardingSphere, einer auf Java basierenden Middleware für Big Data

(Bild: Dangdang Information Technology)

Anwendungsarchitektur in verteilten Szenarien

Wachsendes Datenvolumen und neue Szenarien der Datenverwendung erfordern laut Projektteam von den Datenverwaltungssystemen Fähigkeiten, die über die Kapazität einzelner relationaler Datenbanken hinausgehen. Ziel des Projekts sei es, die Anwendungsarchitektur analog zu den Microservices umzugestalten und flexiblere Data Governance zu ermöglichen.

Der Begriff Sharding stammt aus der Datenbankarchitektur und steht für das horizontale Partitionieren von Daten in einer Datenbank, die einzelnen Partitionen werden als Shard angesprochen. Um die Last zu verteilen, lässt sich jeder Shard auf jeweils separaten Instanzen von Datenbankservern speichern. Apache ShardingSphere bietet solches Daten-Sharding mit verteilten Transaktionen, der Migration von Daten und weiteren Data-Governance-Funktionen. Das Projekt "spricht" mehrere SQL-Dialekte und enthält einen unabhängigen SQL-Parser sowie einen plugfähigen Mikrokernel, mit dem Entwickler laut Projektteam alle Dialekte und -Features über Schnittstellen ein- und ausklinken können.

Hintergrund und Ressourcen

Hinter dem Projekt steht das Unternehmen Dangdang Information Technology, das ShardingSphere ursprünglich als Kernkomponente seiner DaoCloud-Datenbank entwickelt hatte. Zum jetzigen Zeitpunkt scheint die Technik hauptsächlich in einer Reihe größerer chinesischer Unternehmen zur Anwendung zu kommen, zum Beispiel auf Videoplattformen und bei Einzelhändlern. In Europa ist die Zurückhaltung bei Open Source made in China weiterhin groß – insbesondere beim Umgang mit Big Data.

Die Anerkennung des Apache-Status stellt insofern einen großen Schritt dar für das chinesische Unternehmen, aber auch für die globale Open-Source-Gemeinde, die sich weiterhin Anbieterneutralität auf ihre Fahnen schreibt. Details zum Projekt und die Begründung zur Aufnahme als Top-Level-Projekt lassen sich dem Blogeintrag der Apache Software Foundation entnehmen. Apache ShardingSphere steht bei Apache.org zum kostenfreien Download bereit. Das Projekt ist auch auf Twitter vertreten. (sih)