Manege frei

Viel Zeit hatten sich die Organisatoren nicht gelassen. In knapp zwei Monaten entstand der bisher größte Linux-Cluster mit über 512 Rechnern. Die Feuerprobe bestand das Projekt Anfang Dezember während der WDR-Computernacht in Paderborn.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 14 Min.
Von
Inhaltsverzeichnis

Zum 250sten Mal strahlte der WDR am 5./6. Dezember seinen Computer-Club aus. Eine solche Gelegenheit wollten sich Linux-Anhänger um Tom Schwaller vom Linux-Magazin und den Berliner Sebastian Hetze nicht entgehen lassen. Sie trommelten in Newsgroups und Mailinglisten Interessierte für den größten jemals gebauten Linux-Cluster zusammen.

Eine Zweierpotenz mußte es sein, und so entschied man sich für 512 Rechner, die über ein 100-MBit-Ethernet verbunden sein sollten. Viele Computer und die gesamte Infrastruktur (Switches et cetera) stammten von Sponsoren, eine Liste enthält der Kasten ‘Cluster-Sponsoren’. Privatpersonen konnten sich mit ihren Rechnern ebenfalls beteiligen. Zusätzliche Spannung trug die Tatsache bei, daß es sich nicht um ein homogenes Netz handelt: Neben der Mehrheit von Intel-Maschinen waren 60 Alphas beteiligt. Getauft wurde das Kind auf den Namen CLOWN: CLuster Of Working Nodes.

Viel Hardware nimmt zwar viel Platz weg, ist aber nicht übermäßig telegen. Es mußte also Software her, die die Leistungsfähigkeit eines Clusters demonstrieren konnte. Damit diese Spezialprogramme nicht der bereits installierten Software in die Quere kommen, erstellte Florian Lohoff zunächst eine spezielle Distribution, die sich als Datei auf der Festplatte installieren läßt (siehe ‘Was auf den Linux-Systemen lief’).

Zur Koordinierung der Verteilung von Aufgaben zwischen den Rechnern diente PVM (Parallel Virtual Machine). Zusätzlich zu den Modifikationen an der eigentlichen Distribution sind zwei Anwender erforderlich (pvm34 und povray), die dazu dienen, die Applikationen laufen zu lassen. pvm34 soll das Experimentieren mit der aktuellen Entwicklerversion 3.4beta7 von PVM ermöglichen. Im Heimatverzeichnis von pvm34 sind ein pvm3d vorhanden sowie der Beispiel-Client mtile zur verteilten Berechnung von Apfelmännchen. Unter dem Anwender povray ist die aktuelle Version von povray (3.02) zu finden. Sie ist um einen Isosurface-Patch erweitert, der nötig ist, um einen von der Uni Konstanz bereitgestellten Film zu berechnen. Auf dieser Basis zeigte Povray seine Leistungsfähigkeit beim Rendering verschiedener Filme.

Für die parallele Berechnung der Filme auf Frame-Basis wird povray für jedes einzelne Bild aufgerufen. Die Lastverteilung organisiert ein von Roger Butenuth (Uni Paderborn) für diesen Zweck erstelltes Programm, das auf RPC basiert. Die Entscheidung für RPC fiel wegen seiner Robustheit und des verbindungslosen Protokolls (UDP). Bei TCP hätte der Lastverteilungsserver mit 512 offenen Verbindungen kämpfen müssen.

Das Programm ist für beliebige andere Aufgaben einsetzbar, die nach dem Master-Worker Schema arbeiten. Zur Robustheit trägt bei, daß man es bei einem Absturz mit den Informationen aus einer Zustandsdatei wieder neu starten kann. Aufträge, die ein Client nicht rechtzeitig abliefert, schickt der Server zu einem anderen Rechner. Die Kommandozeilen für die Clients erzeugt ein awk-Script auf dem Server. Es muß auf Eingabe der Arbeitspaketnummer nur mit einer Kommandozeile für dieses Paket antworten. Nach der Fernsehnacht wird der Lastverteiler unter der GPL veröffentlicht.

Um Universales kümmerte sich das Programm Cactus, entwickelt vom Potsdamer Albert-Einstein-Institut. Es löst die Einstein-Gleichungen, das sind zehn nichtlineare, gekoppelte hyperbolisch-elliptische partielle Differentialgleichungen. Sie beschreiben Gravitationswellen, Schwarze Löcher, Neutronensterne et cetera und gehören zu den kompliziertesten in der mathematischen Physik. Cactus ist modular aufgebaut und läuft auf verschiedenen Supercomputer- und Unix-Maschinen. Aufgrund von Netzproblemen skalierte Cactus auf dem Cluster nicht so gut wie erwartet - so lag beispielweise der Skalierungsfaktor bei 20 Knoten nur bei 0,78. Während der Computernacht berechnete Cactus auf 32 Knoten lineare Gravitationswellen, zur Visualisierung der Ergebnisse diente IDL [1].

Neben der Beschaffung von Hard- und Software entstanden einige Schwierigkeiten durch die schiere Menge der Maschinen: Für Stromversorgung und Abfuhr der entstehenden Wärme war zu sorgen sowie eine hinreichend leistungsfähige Infrastruktur für das Netzwerk zu beschaffen. Zur Hitzebekämpfung mußte schließlich noch die Paderborner Feuerwehr einspringen: Sie verlegte große Plastikrohre, die Winterluft ins Gebäude bliesen und die Temperatur so im erträglichen Bereich zwischen 30 und 32 Grad hielten (siehe Foto).

Für einen Eintrag im Guinness-Buch der Rekorde dürfte es allemal reichen: insgesamt waren bis zu 570 Knoten im Cluster aktiv, von denen bis zu 520 im Verbund als virtueller Linux-Supercomputer an Filmen oder mathematischen Problemen rechneten. Auch in Sachen Eintrag in die Liste der Top-500 des Supercomputing stehen die Aktien nicht schlecht. Nach einigen Anpassungsarbeiten lief auf einem Alpha-Sub-Cluster mit 48 Knoten der dazu nötige Linpack-Benchmark durch. Die erzielten Ergebnisse lassen vorbehaltlich einer Verifizierung eine Plazierung um Rang 250 erwarten. Details dazu wird iX in der nächsten Ausgabe liefern. Anmerkung am Rande: die Computernacht war nach der Fußball-WM die zweitgrößte WDR-Produktion des Jahres - ein Rahmen, der dem Cluster-Event gerecht wurde.

[1] Dieter Frieauff; Malen mit Zahlen; Objektorientierte Datenvisualisierung mit IDL 5; iX 11/97, S. 98 ff.

Mehr Infos

Das letzte Mal

Fernsehen kann Strafe sein. Dem Linux-Cluster sei die kostenlose Werbung gegönnt - aber wer erträgt diesen WDR-Computerclub nun eigentlich seit über zehn Jahren? Da strapsen sich zwei Moderatoren ab, die uninspirierter, langweiliger, desinteressierter und ahnungsloser kaum vorstellbar sind. Sie sondern Weisheiten ab wie "Aus der Raumfahrt ist der Computer nun nicht mehr wegzudenken", "die 25 Buchstaben des Alphabets" oder "Ja, das sieht sehr schön aus, machen Sie mal weiter so" zu einem Kalligraphen, von dem keiner weiß, warum er in dieser Sendung herumsaß.

Die Crème de la Crème der deutschen Hochschulforschung schlägt sich in Paderborn die Nacht um die Ohren, um einem Journalisten maximal 90 Sekunden Antworten zu geben, die diesen offenbar nicht interessieren. Kein roter Faden, kein Zusammenhang, statt dessen Erklärungen für das Publikum, wie schwer die eigene Arbeit und wie groß die Begeisterung über eben diese Arbeit bei eben diesem Publikum sei - die Inkarnation des Loopback-Device.

Peinlich und uninteressant, das alles. Eine Entschuldigung wert wäre jedoch das Benehmen Wolfgang Backs gegenüber dem Kollegen von der Deutschen Welle: Vorgestellt mit seinem Namen und dem Zusatz "Chinese", mußte er Backs alberne Nachäffung seiner Muttersprache auf offener Bühne ertragen.

Wohl dem, der hinreichende Alkoholvorräte bereitgestellt hatte - mit zunehmender Umnebelung ließ sich das Ganze wenigstens bis fünf Uhr morgens ertragen.