Supertabellen

Mit Windows HPC Server 2008 R2 kam nicht nur eine neue Version heraus. Parallel dazu stellte Microsoft passende Erweiterungen vor. Dazu zählen die Excel Services, mit denen tabellengesteuerte Berechnungen im High-Performance-Cluster zu realisieren sein sollen.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 5 Min.
Von
  • Nikolai Zotow
Inhaltsverzeichnis

Varianten von oder Erweiterungen für Windows Server als Rechencluster gibt es bei Microsoft seit Längerem. Schon 2001 stellte iX eine Übersicht der Techniken für Rechencluster zusammen, in der Windows ebenfalls als Plattform vorkam [1]. 2007 erschien ein erster Beitrag zu Windows Computer Cluster Server 2003 (CCS) [2]. Mit der Entwicklung zum Windows Server 2008 R2, der im Unterschied zum Vista-basierten Windows Server 2008 dieselbe Grundlage nutzt wie Windows 7 und nur noch als 64-Bit-Version erhältlich ist, änderte Microsoft den Namen zu HPC.

Zu den Neuerungen zählen unter anderem die Excel Services, der Cluster of Workstations und das Diskless Boot. Da Windows Server 2008 R2 als Grundlage dient, verwendet der Cluster das Treiberkonzept von Windows 7. Voraussetzung für den Betrieb sind Rechner mit 64-Bit-Prozessoren von Intel oder AMD. Bis zu vier Prozessoren je Server unterstützt das HPC mit Windows Server 2008 R2 Standard Edition, erst die Enterprise Edition erlaubt den Betrieb mit bis zu acht CPUs je Server.

Mindestens 512 MByte RAM pro Knoten empfiehlt Microsoft, was in der Praxis zu wenig sein dürfte. Maximal sollen 128 GByte RAM je Server möglich sein. In puncto Festplatten sind für die Installation 50 GByte erforderlich. Das Betriebssystem unterstützt RAID, setzt es aber nicht zwingend voraus. Eine weitere Voraussetzung sind zwei Netzwerkadapter für den Kopfrechner, wenn er sich in einem privaten Netzwerk befindet. Microsoft empfiehlt ferner Hochgeschwindigkeitsnetzkarten für den Interconnect.

Neben den genannten Neuerungen gibt es weitere im Betriebssystem. Unter 2008 R2 stehen dem Administrator System-Templates zur Verfügung, mit denen man System-Images erstellen sowie Patches anwenden und anschließend über den gesamten Cluster verteilen kann. Außerdem bietet R2 Failover Services, die in Kombination mit dem SQL Server eine „Kopie“ des Kopfrechners herstellen, mit der das System im Falle eines Hardwareversagens auf einem anderen weiterlaufen kann. Zusätzliche neue Diagnostikwerkzeuge runden das Angebot ab.

Der Cluster of Workstations (CoW) bietet an, nicht genutzte Ressourcen von Arbeitsplatzrechnern für Berechnungen im Verbund mitzunutzen. Er entspricht im Wesentlichen einem Reversed Grid, bei dem der Head des Clusters die Rechenaufgaben an einzelne Satellitensysteme verteilt, die diese dezentral bearbeiten.

Dazu muss eines der folgenden Betriebssysteme auf der Workstation installiert sein: Windows 7 Enterprise, Professional oder Ultimate. Außerdem ist es zwingend, dass die Workstations und der Head Node im selben Active Directory registriert sind. Der Administrator legt die Nutzung der Workstations als Knoten im Cluster für vorher bestimmten Zeiten einmalig fest. Somit hinkt der Vergleich mit „Seti at home“, das den Arbeitsplatzrechner nur zu ungenutzten Zeiten verwendet. Da bei Microsofts CoW die Arbeitsplatzrechner fest eingebunden sind, wäre das Seti-Verfahren nicht sinnvoll – die laufenden Berechnungen würden durch den Nutzer des Arbeitsplatzrechners sonst ständig unterbrochen.

Aufsuchen: Im Menü unter „Optionen“ muss man die User Defined Function in der XLL als Add-in anmelden (Abb. 1).

Einen Cluster of Workstations kann man in drei Schritten einrichten. Zunächst erstellt der Admin ein Workstation Node Template. Damit legt er die Eckwerte der Verfügbarkeit von Workstations für den Cluster fest. Als Nächstes muss er auf jeder Workstation den HPC Pack 2008 R2 installieren, braucht also in jedem Fall Administrationsrechte. Im dritten Schritt weist er der Workstation eins der vorher definierten Workstation Node Templates zu.

Microsoft Excel ist vielen gut vertraut und gehört mit zu den beliebten Anwendungen für die Erstellung von wirtschaftlichen Analysen. Weniger bekannt dürfte sein, dass man Excel künftig auf High Performance Computing Clustern einsetzen kann. Bleibt die Frage zu klären, wie gut das funktioniert und für welche Kalkulationen es sich lohnt.

Voraussetzung für den Einsatz im HPC sind die Excel Services, die Bestandteil der Enterprise Edition des Windows HPC Servers 2008 R2 sind. Zusätzlich bedarf es der HPC Pack 2008 R2 Client Utilities. Das bedeutet, dass ältere Windows-Versionen nicht infrage kommen.

Sowohl auf der Client-Seite als auch auf dem Kopfserver und den Knoten muss das Betriebssystem des Redmonder Herstellers laufen. Die Nutzung von Excel Services auf Supercomputern setzt außerdem Excel in der Version 2010 voraus, das es auch als Bestandteil von Office 2010 gibt.

Vorteile des verteilten Rechnens sind dort gegeben, wo Aufgaben in hohem Maße parallelisierbar sind. Generell gibt es zwei Methoden, Excel-Kalkulationen auf einem Cluster bearbeiten zu lassen. Die erste Methode, XL Runner, erfordert Excel-Installationen auf jedem Knoten, der für die Ausführung der Berechnungen herangezogen wird. Alternativ dazu bietet Microsoft die Methode mittels UDF-Offload (User Defined Libraries) über Excel-Bibliotheken an, die mit einer einzigen Excel-Installation auf dem Arbeitsrechner oder dem Head auskommen.

XL Runner verteilt komplexe Excel-Tabellen in einem HPC-Cluster. Die Knoten können mehrere Ein- und Ausgaben simultan ausführen. Der Anwender braucht keine Programmierkenntnisse, die Beherrschung von Excel reicht aus.

Den vollständigen Artikel mit den Details der Client-Konfiguration finden Sie in iX 12/2010

[1] Uwe Harms; Alter Wein; Cluster-Landschaft historisch betrachtet; iX 7/01, S. 128

[2] Harry Schlagenhauf, Steffen Stadel; Number Crunching; Knoten geplatzt; Microsofts High-Performance-
Computing: Windows CCS 2003; iX 9/2007, S. 64

Mehr Infos

iX-TRACT

  • Windows HPC Server 2008 R2 ist der erste, in dem man mit Excel Berechnungen dank der Excel Services durchführen kann.
  • Dazu bietet Microsoft zwei Verfahren: den XL Runner für Excel-Instanzen auf den Knoten und UDF mit verteilten User Defined Functions in Form von Libraries.
  • Bei der Konfiguration gibt es eine Reihe von Punkten zu beachten, die unter anderem die Verwaltung und Organisation mit Active Directory betreffen.

(rh)