Job-Queuing mit dem Workload Manager Slurm

Das Job-Scheduling auf einem HPC-Cluster ist längst keine banale Angelegenheit mehr. Durchgesetzt hat sich deshalb das ständig weiterentwickelte Slurm.

Artikel verschenken

19.06.2024, 12:00 Uhr

Lesezeit: 15 Min.

iX Magazin

Von

David Neujahr

Job-Queuing mit dem Workload Manager Slurm
- Verteilter Aufbau: die Architektur von Slurm
Zentraler Storage als Voraussetzung im Cluster
Konfiguration in wenigen Dateien
Arbeiten mit Slurm
Accounting für detaillierte Berichte
Ausblick

Artikel in iX 7/2024 lesen

Für sich selbst und später für andere Rechenzentren, die Hunderte von Servern und Tausende von CPUs verwalten müssen, hat das LLNL (Lawrence Livermore National Laboratory) das Werkzeug Slurm – Simple Linux Utility for Resource Management – entwickelt. Die leistungsstarke Open-Source-Software soll das Verwalten von Ressourcen in großen HPC-Umgebungen (High-Performance Computing) erleichtern und es damit den Anwendern erlauben, die Ressourcen effektiv zu nutzen. Seit seiner Veröffentlichung im Jahr 2002 erfreut sich Slurm stetig wachsender Beliebtheit in der HPC-Community und nimmt dort inzwischen eine führende Rolle unter den Werkzeugen für das Ressourcenmanagement ein. Derzeit betreut und entwickelt das Unternehmen SchedMD Slurm weiter.

Slurm verwaltet alle Arten von Rechenaufgaben eines HPC-Clusters, von der Simulation bis zur Analyse großer Datenmengen. Diese Arbeitslasten heißen bei Slurm Jobs; sie verteilt die Software über den Cluster, weist Ressourcen effizient zu und stellt sicher, dass kritische Aufgaben priorisiert werden – bleibt dabei aber einfach zu bedienen. Falls zum Zeitpunkt der Einreichung eines Rechenjobs nicht ausreichend CPU-Kerne zur Verfügung stehen, stellt es die Anfrage automatisch in die Warteschlange und startet sie, sobald genug Kerne verfügbar sind.

David Neujahr ist Netzwerk- und Systemadministrator. Bei der Menzel IT in Berlin befasst er sich hauptsächlich mit der Automatisierung von HPC-, Machine-Learning- und auch Private-Cloud-Computing-Clustern.

Slurm kann nahezu alle Rechen- und Simulationsjobs auf einem Cluster starten und bietet dabei eine umfangreiche Unterstützung für MPI (Message Passing Interface). MPI hat sich im HPC zu einem wichtigen Instrument entwickelt, um parallele und verteilte Anwendungen effizient auszuführen. Bei der Zuweisung von Ressourcen berücksichtigt Slurm CPUs und RAM, aber auch GPUs. Zudem bietet es umfassende Sicherheitsfunktionen wie die Konfiguration der Linux-Steuerungsgruppen cgroups. Diese Option stellt sicher, dass die Ressourcen für jeden einzelnen Job isoliert sind, sodass sie weder die Ressourcen anderer Jobs beeinträchtigen noch ausbrechen können. Darüber hinaus sind mit Slurm verwaltete Cluster ausgesprochen skalierbar, da eine Erweiterung auf Tausende Nodes keine große Herausforderung darstellt.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Passen auf eine Diskette: Mini-Betriebssysteme ausprobiert

MenuetOS und KolibriOS laufen blitzschnell auf alten x86-Rechnern, bringen GUI sowie Anwendungen mit und passen komplett auf eine 1,44 MByte große Diskette.

Mit der Apple Watch im Schlaflabor: So gut zeichnet sie Schlaf auf

Wie sich die Apple Watch nachts gegenüber anderen Schlaf-Trackern schlägt und wie im Vergleich zur Analyse durch ein Schlaflabor.

Die eigene Straße auswerten: Verkehrszählung zuhause mit der Telraam S2

Wie dicht ist der Verkehr vor dem Fenster, wie viele Autos, Lastwagen, Fahrräder und Fußgänger kommen täglich vorbei? Die Verkehrskamera Telraam S2 zählt mit.

Sieben Apps für fahrradgerechte Routenplanung und Navigation im Test

Apps für Radtouren helfen nicht nur bei der Routenplanung, sie geben vor allem während der Fahrt die Richtung vor und weisen sogar auf Sehenswürdigkeiten hin.

Wie im Kino! Die analoge Fotografie hat noch immer ihre Berechtigung, wenn man auf der Suche nach einem klassischen, authentischen Look ist. Der Kontrast und das Rauschen des Chemiefilms sind mit digitalen Filtern nur schwer zu simulieren.Canon AE-1 mit 50 f/1.8, offenblendig. Film: Ilford Delta 400 135-36 (400 ASA). Push-Entwicklung +1 EV. , Model: Miri Be, Co-Fotograf Michael Eichelsbacher

Filmfotografie: Analog durch die Nacht

Der analoge Look von Künstlern wie Lindbergh oder Dennis Stock lässt sich mit einer Digitalkamera kaum erreichen. Warum also nicht mal wieder Film nutzen?

Sieben Navi-Apps mit Android Auto und Apple CarPlay im Test

Wenn Auto und App die Verbindung via Apple CarPlay oder Android Auto unterstützen, steuern Sie alles über das Infotainmentsystem. Wir haben die Apps getestet.

Android Auto & Apple CarPlay nachrüsten

nach oben

Alle Angebote

Newsletter heise-Bot Push Push-Nachrichten

${intro} ${title}