Drei Unified-Memory-Workstations für lokale KI im Test

Bezahlbare Workstations für lokale KI: Die Unified-Memory-Workstations HP Z2 Mini G1a, Asus Ascent GX10 und Apple Mac Studio M4 Max im Check.

Artikel verschenken

(Bild: Vanessa Bahr / KI / iX)

07:00 Uhr

Lesezeit: 19 Min.

iX Magazin

Von

René Peinl
Thomas Weber

Drei Unified-Memory-Workstations für lokale KI im Test
- Drei Geräte im Vergleich
Die Macht der Parameter und Arbeitslast
Hürden bei der Inbetriebnahme, AMD ROCm und Apple MLX
Ergebnisse der Messungen
MLX vs. GGUF vs. FP16
Fazit und Wertung

Artikel in iX 5/2026 lesen

Zur digitalen Souveränität gehört auch der Betrieb lokaler KI-Modelle auf eigener Hardware. Viele meinen, sie hätten nur die Wahl zwischen den kleinen Ablegern der großen Sprachmodelle (Large Language Models, LLMs) oder einer Investition von über 100.000 Euro in Rechenzentrumshardware wie H200. Dabei stoßen Modelle wie Ministral 3 mit 14 Milliarden Parametern, die noch in gängige Consumer-Grafikkarten mit 16 oder 24 GByte VRAM passen, schnell an die Grenzen ihrer Leistungsfähigkeit.

Deutlich leistungsfähiger werden die Modelle erst ab einer Größe von 100 Milliarden Parametern, die aber selbst mit Quantisierung, also dem Verwenden von Parametern mit geringerer Genauigkeit wie INT4 statt FP16, eine GPU mit mindestens 80 GByte VRAM erfordern.

Unified-Memory-Workstations bieten bezahlbare KI-Rechenleistung im kompakten Formfaktor.
Die Geräte eignen sich für LLMs der Größenklasse um 100 Milliarden Parameter, besonders bei der Mixture-of-Experts-Architektur.
Wir vergleichen die Leistung von DGX Spark, Ryzen AI Max+ 395 und Apple M4 Max für dichte und dünn besetzte Modelle bei Prefill und Decode.

René Peinl ist Professor für ressourceneffiziente KI für Textverständnis an der Hochschule Hof und leitet die Forschungsgruppe Multimodale KI.

Thomas Weber ist Forschungsreferent am Institut für Informationssysteme (iisys) und betreut IT- und Forschungsprojekte.

Für KI-Entwickler und die Inferenz in KMU ist daher eine neue Gerätekategorie interessant, die viel VRAM mit bezahlbaren Preisen vereint: Unified-Memory-Workstations. Der Artikel vergleicht drei dieser Geräte.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Gehaltsreport: Was IT-Profis und KI-Spezialisten wirklich verdienen

Welches Gehalt bekommen die Kollegen? Wir zeigen, was IT-Profis verdienen – vom Supporter bis zum CIO.

Wi-Fi-7-Router für Glasfaser und DSL im Test: Deutsche Telekom Speedport 7

Mit dem Speedport 7 funkt das Magenta-Mesh mit modernem Wi-Fi 7. Wir haben Router und Repeater ausprobiert.

(XXL-)Speicher für Balkonkraftwerke im Test

Balkonkraftwerke mit Speicher versprechen einen automatischen Ausgleich des Stromverbrauchs. Vier Systeme müssen beweisen, was davon im Alltag übrig bleibt.

Was die Voraussetzungen für den Kaltstart eines Rechenzentrums sind

Für den RZ-Neustart nach einem Totalausfall muss die Infrastruktur auf den Ernstfall vorbereitet werden. Dabei hilft das Site Reliability Engineering.