Lokale KI: Machine Learning und KI auf Apple Silicon mit MLX betreiben

APIs und eine einheitliche Sicht auf die Hardware machen es Entwicklern leicht, mit Apples MLX-Framework Sprachmodelle zu betreiben und ML-Anwendungen zu bauen.

Artikel verschenken

1

21.03.2025, 07:30 Uhr

Lesezeit: 11 Min.

iX Magazin

Von

Ramon Wartala

Lokale KI: Machine Learning und KI auf Apple Silicon mit MLX betreiben
- Beispiele ausprobieren
Klassisches Machine Learning
Einfache Retrieval Augmented Generation mit LangChain
Bilder verstehen mit Vision Language Models
Feintuning mit MLX
Fazit

Artikel in iX 4/2025 lesen

Im Vergleich zum gut abgehangenen Nvidia-Stack mit seiner Integration von Beschleunigerkernen und CUDA-Software haben es ARM-basierte Systeme immer noch schwer, beim Thema Machine Learning und KI mitzuhalten. Apple will mit MLX dagegenhalten, einem Machine-Learning-Framework, das die CPU- und GPU-Kerne der Apple-SoCs für KI- und Machine-Learning-Entwickler erschließt.

Entwickelt von Apples internem Machine-Learning-Forschungsteam, adressiert MLX die steigenden Anforderungen moderner KI-Entwicklung und -Forschung auf Apple-Systemen. Charakteristisch für MLX ist sein intuitives API-Design, das stark von populären Python-Bibliotheken wie NumPy beeinflusst ist. Die Schnittstelle zu Operatoren für neuronale Netze und deren Optimierung lehnt sich an PyTorch an. Zudem setzt MLX auf Lazy Evaluation, bei der Berechnungen erst dann ausgeführt werden, wenn alle Operationen im Berechnungsgraphen definiert wurden – eine Technik, die Effizienz und Performance steigert.

Mit dem Open-Source-Framework MLX von Apple lässt sich Apple-Silicon-Hardware direkt für Machine Learning und KI nutzen.
Entwickler können MLX über C/C++-, Swift- und Python-APIs einbinden.
MLX unterstützt sowohl CPU- als auch GPU-Kerne der Apple-SoCs, Apples Neural-Engine-Kerne dagegen noch nicht.
MLX nutzt Apples Unified Memory Architecture, um Operationen parallelisiert auszuführen.
Große Sprachmodelle lassen sich nicht nur einfach einbinden, sondern auch quantisieren.
Die MLX-Community auf Hugging Face stellt permanent neue, angepasste Modelle zur Verfügung.
In Frameworks wie LangChain und LlamaIndex sind MLX-Modelle nutzbar.

MLX profitiert von der einheitlichen Speicherarchitektur auf Apples Systemen, die eine gemeinsame Speichernutzung aller Recheneinheiten ermöglicht. Das erlaubt eine nahtlose und hochperformante parallele Verarbeitung von Machine-Learning-Workloads auf CPU und GPU. Diese Architektur unterscheidet sich damit von Intel-basierten Systemen und der Speicherverwaltung in Nvidias GPU-Architektur, wo separate Speicherpools und explizite Speichertransfers erforderlich sind.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

MacBook Neo im Test: Der Budget‑Mac mit dem Smartphone‑Herz

Buntes Alugehäuse, Retina‑Display und macOS – aber iPhone‑Prozessor und 8 GByte RAM: Unser Test zeigt, ob Apple bei seiner neuen MacBook-Linie sinnvoll spart.

MacBook Pro mit M5 Max im Test: Apples neue mobile Boliden

Apple hat bei seinen MacBook Pros im März die Prozessorvarianten M5 Pro und Max eingeführt. Im Test untersuchen wir Performance, SSD und mehr.

Aufstellort Solar-Batteriespeicher: Was bei Lebensdauer und Sicherheit zählt

Ein Heimspeicher brennt nicht häufiger als ein Trockner. Doch der Aufstellort entscheidet mit über Lebensdauer, Sicherheit und Leistung.

Galaxy S26 Ultra im Test: Samsungs Gratwanderung mit Privacy Display

Samsung schraubt nur behutsam an der Hardware seiner Top-Smartphones und setzt stattdessen voll auf die Software. Das neue Privacy Display hat einen Haken.