ESUN kurz erklärt: Ethernet for Scale-up Networking für Rechenzentren
Ankündigungen neuer Rechenzentren mit zehntausenden Nvidia-Chips offenbaren Engpässe in der Prozessor-Kommunikation. Die will das ESUN-Konsortium vermeiden.
- Uwe Schulze
Eine wichtige Eigenschaft von Serverarchitekturen ist die Skalierbarkeit, da die Workloads in der Regel stetig steigen. In der Vergangenheit erfolgte das Aufrüsten von Servern überwiegend durch zusätzliche CPUs, Speicherriegel und Festplatten. Im Netzwerk kamen modulare Switches zum Einsatz, die den Einbau weiterer Line Cards erlauben. Dies bezeichnet man als Scale-up oder Vertical Scaling das vor allem kurze Wege für die Daten und schnelle Übertragungstechniken innerhalb des Chassis bietet. Mit zunehmender Virtualisierung skalierte man verstärkt durch das Hinzufügen weiterer physischer oder virtueller Instanzen. Die Last wird dabei auf mehrere Knoten verteilt (Scale-out oder Horizontal Scaling). Gleichzeitig erhöht sich die Verfügbarkeit durch lokale und verteilte Redundanz.
Damit die Verbindung zwischen den Nodes keinen Engpass bildet, entstanden neue Netzwerkarchitekturen und schnellere Ethernet-Schnittstellen. Sichtbar wird dies im Rechenzentrum, wo statt modularer Switches in großen Chassis zunehmend eng vermaschte Hochleistungsswitches mit oft nur einer Höheneinheit in einer Spine-Leaf-Topologie arbeiten.
- In modernen Scale-out-Architekturen übernehmen eng vermaschte Hochleistungsswitches in einer Spine-Leaf-Topologie die Kommunikation zwischen den Nodes.
- Die rasante Entwicklung von KI-Workloads ließ die Idee reifen, Ethernet auch für diese Aufgabe fit zu machen.
- Ein Industriekonsortium will im Projekt Ethernet for Scale-up Networking die technischen Details diskutieren und mittelfristig in einen IEEE-802.3-Standard gießen.
Scale-out-Netzwerke sind flexibel, decken viele Anwendungsfälle ab und lassen sich in großen Stückzahlen günstig produzieren. Dem OSI-Schichtenmodell folgend sind sie modular aufgebaut und bieten viele Schnittstellen. Dies führt aber auch dazu, dass die Latenz im Bereich von Millisekunden liegt und sich systembedingt nicht weiter reduzieren lässt.
Das war die Leseprobe unseres heise-Plus-Artikels "ESUN kurz erklärt: Ethernet for Scale-up Networking für Rechenzentren ". Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.