Marktübersicht: KI-Server mit GPUs im Überblick

Mit der zunehmenden Leistung neuer High-End-GPUs drängen neue Serverarchitekturen auf den Markt. Eine Übersicht über spezialisierte Server für KI-Aufgaben.

Artikel verschenken

(Bild: Nvidia)

16.05.2024, 13:00 Uhr

Lesezeit: 22 Min.

iX Magazin

Von

Hubert Sieverding

Marktübersicht: KI-Server mit GPUs im Überblick
- Leistungsaufnahme als Leistungssport
Die Qual der Wahl
Server mit PCIe-GPUs
Wassergekühlte Systeme im Kommen
Systeme mit AMDs GPU MI300
Systeme mit Intels Max 1550 / Gaudi
Fazit

Artikel in iX 6/2024 lesen

Wer den Performancehunger seiner KI-Anwender befriedigen will, kommt mit Standardservern nicht sehr weit. Doch selbst wer zu KI-optimierten Systemen greift, die durch viele PCIe-Slots glänzen, wird schnell an deren Grenzen stoßen. Bereits Anfang 2020, noch bevor die KI-Welle durch die Presse schwappte, konnten wir im Labor mitansehen, wie die zwei Xeon-CPUs eines imposant wirkenden Dell PowerEdge DSS8440 (Test) mit seinen vier Höheneinheiten, 12 Lüftern, vier Netzteilen und gut 50 kg kaum in der Lage waren, den Datenhunger der zehn eingebauten GPUs vom Typ Nvidia V100 über PCIe 4.0 zu befriedigen.

Hubert Sieverding arbeitet nach langjähriger Tätigkeit in der Automobilbranche als freier Autor.

In den letzten vier Jahren ist PCIe doppelt so schnell, die Server sind nochmals größer geworden und der Energiebedarf weiter gestiegen – doch am Engpass zwischen CPU und GPU hat sich wenig geändert. Abhilfe schaffen sollen neue Protokolle und Interfaces wie OAM (Open Application Model) oder die Integration der CPU mit der GPU unter gemeinsamer Nutzung von schnellem HBM-Speicher (High Bandwidth Memory). Welche Systeme mit diesen neuen Techniken der Markt hergibt, zeigt diese Marktübersicht.

Spätestens seit dem KI-Hype um ChatPGT gibt es keinen Serveranbieter ohne GPU-Server mehr. Namhafte Hersteller, die den Trend seit Jahren verpennt haben, widmen in ihren Werbeaussagen einen Universalserver zum GPU-Server um. Dazu reicht es in der Regel aus, passende Netzteile mit hoher Leistung, etwa 2 × 3000 Watt, kräftige Lüfter und PCIe-Slots für doppelbreite GPU-Zusatzkarten bereitzustellen. Besonders gern greifen Hersteller derzeit zu AMDs CPU Epyc 9004, die die momentan größte Anzahl an PCIe-Lanes bietet. Bei Intels Xeon braucht es gegebenenfalls einen PCIe-Switch – insbesondere, wenn zudem viele NVMe-Laufwerke im Spiel sind. Bietet das 2U-Chassis Platz für zwei nebeneinanderstehende H100-GPUs, stimmt sogar die Werbeaussage "Nvidia H100 Tensor Core GPUs können paarweise NVLinked werden", ohne dass das Systemdesign großartig verändert wurde.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Smart Home: Home Assistant mit nützlichen Apps erweitern

Apps in Home Assistant erweitern das System und machen es flexibler. Wir zeigen, was mit ihnen möglich ist.

Canon EOS R6 Mark III im Test: Kraftpaket für Foto und Film

Neuer Sensor, hohe Serienbildrate und starkes Raw‑Video. Wir haben getestet, was die spiegellose Vollformatkamera in der Praxis wirklich leistet.

, Copyxspace, stock.adobe.com / heise medien

USB-C: Warum Sie eigentlich immer das falsche Kabel anschließen

Das richtige Kabel für USB-C-Verbindungen zu finden, ist ein Glücksspiel: Das eine lädt zu langsam, beim anderen kriechen die Daten im Schneckentempo. Was tun?

Tschüss, Big Tech: Gmail-Postfach exportieren und E-Mails löschen

Sie haben Ihren E-Mail-Anbieter gewechselt? Dann müssen Sie jetzt noch Ihren Datenschatz aus dem alten Postfach heben. Wir erklären, wie das geht.

UpdateiWork ganz neu: Pages, Numbers & Keynote 15 für Mac, iPhone und iPad im Test

Apples Office-Apps erhalten das Liquid-Glas-Design und sind nun Teil von Apple Creator Studio. Das Abo ist kein Zwang, doch einige Features gibt es nur damit.

LaTeX: Professionelle Briefe ohne Layoutstress erstellen

Ansehnliche Briefe, jedes Mal aufs Neue, ohne mühseliges Gefrickel – LaTeX machts möglich. Wir zeigen, wie Sie Ihre Korrespondenz auf ein neues Niveau heben.