Hawk: Weltschnellster Supercomputer mit AMD-Prozessoren startet am HLR Stuttgart

Seite 2: Interview: Supercomputer und Nachhaltigkeit

Inhaltsverzeichnis


heise online: Herzlichen Glückwunsch zu dieser schönen neuen Anlage, allerdings hat es ja ein paar Verzögerungen gegeben.

Resch: Der Terminplan war sehr ambitioniert, wir hatten gehofft das System schon Anfang Januar aufgestellt zu haben. Es gab eine Verzögerung von sechs Wochen, aber das ist nicht dramatisch, spielt also keine große Rolle. Unser Problem war nur die Planung mit dem Abbau des alten Systems, weil wir haarscharf mit dem Energiehaushalt kalkulieren müssen.

heise online: Und jetzt laufen die ersten Tests ...

Resch: Ja, und nach den ersten Tests kommt dann der Langzeit-Stabilitätstest von 30 Tagen.

heise online: Gehört dazu auch der Linpack-Lauf?

Resch: Ja schon, aber den können die Systeme eigentlich immer. Der Stabilitätstest im Normalbetrieb mit vielen Usern, das ist viel stressiger ... Den Linpack haben wir bereits vor ein paar Wochen mal auf 121 Knoten laufen lassen und kamen damit auf sehr gute 84 Prozent Effizienz. Theoretisch müsse man dann hochgerechnet für das ganze System auf bis zu 21 PFlops kommen. Ich hab nichts gegen den Linpack, aber wenn ich mir eine Maschine kaufe, um einen hohen Linpack zu haben, habe ich meinen Beruf verfehlt. Wir haben die klare Aufgabe den Wissenschaftlern "sustained performance" zu bieten.

heise online: Nur liefert der Linpack doch so einen schönen einfachen Wert für die Politiker ....

Resch: Ach, ich habe drei Ministerpräsidenten [Teufel, Öttinger, Kretschmann] bei den Einweihungen da gehabt, und immer konnte ich ihnen das mit Linpack und der Top500-Liste erklären und alle haben das gleich verstanden – man muss ihnen eben nur die Wahrheit sagen.

heise online: Das Apollo-9000-System ist nirgendwo öffentlich dokumentiert, arbeitet es wie Apollo 8000 mit energieeffizienter Warmwasserkühlung?

Resch: Ja, wenn auch mit 25/35° nicht so warm wie bei anderen Warmwassersystemen, aber immerhin um 10 Grad wärmer als beim Vorgänger Hazel Hen. Wir erwarten, dass wir unsere Kühlaufwendungen monetär und energiemäßig substantiell reduzieren können. Dazu haben wir bereits vor fünf Jahren ein Programm gestartet, um eine maximale Optimierung für das Thema Stromversorgung und Kühlung zu erreichen.

heise online: Nutzen Sie auch die Abwärme?

Resch: Wir heizen bereits mit der alten Maschine das HLRS-Gebäude und möchten gerne das ins Gesamtheizungssystem der Uni integrieren. Aber mit den alten Gebäuden ist die Umrüstung schwierig, da setzen wir lieber auf die in den nächsten Jahren geplanten Neubauten.

heise online: Die Energieaufnahme ist die gleiche wie beim alten System?

Resch: In Normalbetrieb schon, nur beim Einschalten [und im Linpack-Lauf] liegt sie 10 bis 15 Prozent höher. Wir arbeiten hier mit zwei Instituten zusammen, um in der Zukunft den Energiebedarf noch viel variabler gestalten zu können.

heise online: Sie leiten ja nicht nur das HLRS, sondern auch das Institut für Höchstleistungsrechnen und geben Lehrveranstaltungen, darunter auch "Nachhaltigkeit für Ingenieure".

Resch: Wir haben zwei wesentliche Richtungen, die uns wichtig sind und die wir in den letzten zwei Jahren vorangetragen haben und die stehen alle unter dem Oberbegriff "Digitalisierung und Gesellschaft". Dazu gehört die Nachhaltigkeit, die sehr viel mit Energieverbrauch zu tun hat, aber auch mit dem allgemeinen ökologischen Fußabdruck, den wir hinterlassen. Es geht etwa bei der Kühlung auch um Chemikalien und um Lärmemissionen.

Das andere Thema heißt: Wie gehe ich mit meiner Verantwortung um, die ich gegenüber der Gesellschaft habe. Ich kann nicht nur ein technisches Ergebnis abliefern sondern muss mich auch mit der Frage befassen, welchen Einfluss ich auf bestimmte Themen habe. Dazu gehört der zusammen mit der Umweltakademie gestaltete Kurs "Nachhaltigkeit für Ingenieure", aber auch eine Vorlesung zu Computerethik. Hinzu kommt eine Arbeitsgruppe, die sich mit Wissenschaftstheorie oder -philosophie der Simulation beschäftigt. Vor zwei Jahren haben wir zudem mit Zustimmung der Ministerin einen gesellschaftspolitischen Beirat ins Boot geholt, mit Leuten aus ganz unterschiedlichen Lebensbereichen.

heise online: Man kann also heutzutage nicht einfach nur Rechner betreiben ..

Resch: Genau, man kann es sich gar nicht mehr leisten, zu sagen, man betreibe nur einen Rechner. Aus zwei Gründen: Bei den Budgets, um die es hier geht, kann man nicht einfach sagen: Gib mir das Geld und dann kauf ich ne Maschine, schalte sie ein und dann friss Vogel oder stirb. Und man muss sehr gut begründen können, wozu man ein Rechenzentrum betreibt. Ich glaube, dass die Hardwarekomponente in den kommenden Jahren eine weniger große Rolle spielen wird, als die Frage, wie ich aus diesen Systemen Lösungen hole. Meine Befürchtung ist, dass die Community weiter in die Richtung geht: Lasst uns Spitzenleistung maximieren und dann machen wir uns auf die Suche nach Anwendungen, die man auf diesen Rechnern einsetzen kann. Das halte ich für einen Fehler. Wir müssen uns heutzutage die Frage stellen, welche Probleme sollen wir lösen, wo sind dazu die Anwendungen, diewelche Rechenleistung brauchen und dann schauen wir, welcher Rechner nötig ist.

heise online: Inwieweit spielen Künstliche Intelligenz und Deep Learning dabei eine Rolle?

Resch: Bei der letzten Ausschreibung hatten wir noch keine KI-Benchmarks mit reingenommen, weil die Benutzer vor zwei Jahren noch nicht so weit waren. Aber wir haben ins Pflichtenheft geschrieben, dass der Partner KI ernst nimmt und mit uns den Bereich weiterentwickelt. Das ist ein ganz wichtiger Bestandteil der Kooperation mit HPE, für die eine große Kommission (12 Mitarbeiter von HPE und ähnlich viele von uns) die nächste Ausbaustufe plant, gut ein Drittel davon beschäftigt sich mit KI.

heise online: ... gibts also GPU-Karten zum Nachrüsten?

Resch: Darauf läuft's hinaus. Auch AMD ist in der Kommission, wir schauen aber auch auf Nvidia. Derzeit haben wir einen kleinen GPU-Cluster mit 64 Knoten und einen weiteren mit 64-NEC-Aurora-Karten. Und im Verlauf dieses Jahres werden wir wohl auch erfahren, wie es 2023/24 in Deutschland bei den drei großen Rechenzentren weitergehen wird.

heise online: Hawk wäre ja fast der schnellste Rechner für Industrieproduktion geworden, hätte nicht ENI vorige Woche den neuen Supercomputer HPC-5 in Betrieb genommen. Wie groß ist denn der Anteil der Industrie-Aufträge beim HLRS?

Resch: Die Industrie nutzt den Rechner zu 5 bis 8 Prozent. Weitere 8 Prozent sind für das europäische PRACE-Projekt reserviert. Der Rest wird von einem Lenkungsausschuss an wissenschaftliche Projekte vergeben.

heise online: ... und die Uni Stuttgart mit dem Exzellenzcluster Daten-integrierte Simulationswissenschaft (SimTech)?

Resch: Auch die hat kein Hausrecht, sondern muss sich wie alle anderen über den Lenkungsausschuss bewerben. Auch ich habe kein Mitspracherecht. Das obliegt zwölf Professoren von verschiedenen deutschen Universitäten [unter Vorsitz von Prof. Wolfgang Nagel, Leiter des Zentrums für Informationsdienste der TU Dresden]. Wir prüfen allerdings zuvor, ob ein Antrag technisch machbar ist. PRACE hat ein ein eigenes Komitee, das über die Anträge entscheidet.

heise online: Herr Prof. Resch, vielen Dank für das Gespräch.

Das Interview führte Andreas Stiller. (as)