HPC meets Big Data: Intel veröffentlicht Parallel Studio XE 2016

Das große Softwarepaket aus Bibliotheken, Compilern und Analysewerkzeugen des Prozessorherstellers enthält mit der Data Analytics Acceleration Library eine neue Analysesoftware für Big-Data-Szenarien.

In Pocket speichern vorlesen Druckansicht
Parallel Studio XE 2016
Lesezeit: 3 Min.
Von
  • Alexander Neumann
Inhaltsverzeichnis

Es hat sich eingespielt, dass Intel immer Ende August oder Anfang September ein neues großes Release von Parallel Studio XE herausbringt. Hierbei handelt es sich um ein in verschiedenen Ausgaben konfektioniertes Softwarepaket aus Bibliotheken, Compilern und Analysewerkzeugen zur Entwicklung von C/C++-, Fortran-, aber auch Java-Anwendungen für die eigenen Prozessorarchitekturen nutzende Systeme. Seine größte Verbreitung hat Parallel Studio im HPC-Umfeld (High Performance Computing). Das nun erschienene Parallel Studio XE 2016 berücksichtigt natürlich die mit den jüngsten Xeon- ("Skylake") und Xeon-Phi-Prozessoren ("Knights Landing") eingeführten Features.

Das Unternehmen selbst stellt die neue Data Analytics Acceleration Library (DAAL) heraus, die unter Zuhilfenahme von in C++ und Java geschriebenen Analysealgorithmen dabei helfen soll, aus großen Datenmengen unterschiedliche Analyseszenarien wie Datenerfassung, Preprocessing, Transformation, Data Mining, Datenmodellierung, Datenvalidierung und Entscheidungsfindung abzuleiten. DAAL ist dabei mit Big-Data-Techniken wie Apache Hadoop, Apache Spark oder auch den Programmierplattformen R und Matlab zu nutzen und berücksichtigt Programmiermodelle für Batch-Verarbeitung, Streaming und verteiltes Rechnen.

Entwickler der unter Linux, OS X und Windows zu nutzenden Bibliothek sind anscheinend die Schöpfer von Intels Math Kernel Library (MKL), weswegen James Reinders, Chief Evangelist bei Intel, bei DAAL auch von einer "MKL for Big Data" spricht. Die Bibliothek will also die bei der Verarbeitung großer Datenmengen benötigten Algorithmen mit klassischen Rechenalgorithmen kombinieren, um sowohl Datenverarbeitungsprozesse als auch mathematische Berechnungen durchführen zu können. Intel kommt damit einem Trend nach, dass das Thema Big Data auch im HPC-Umfeld an Bedeutung gewinnt. MKL sei zu einem Zeitpunkt entworfen worden, als alle Daten noch auf einmal im Hauptspeicher abgearbeitet werden konnten. Da sich diese Situation insbesondere in Big-Data-Szenarien geändert hat, soll DAAL durch eine Verlagerung der Rechenarbeiten gerade hier helfen können.

Ebenfalls neu ist der Vectorization Advisor, ein Analysewerkzeug für Vektorisierungen, durch das Fortran- und C++-Anwendungen die gegenwärtigen Intel-Prozessor voll ausnützen können sollen. Das neue Tool ist Bestandteil des Intel Advisor XE 2016, einem Werkzeug zum Aufzeigen von Hinweisen, wo sich Parallelität im seriell ausgeführten Code nutzen lässt und sich Threads implementieren lassen. Eine bessere Leistung soll sich durch den Vectorization Advisor herstellen lassen, indem das Tool Hinweise zu neuen Vektorisierungen gibt oder auf Schwächen bei bestehenden Vektorisierungen hinweist. Konkret können Entwickler damit Schleifen identifizieren, die am meisten von einer Vektorisierung profitieren können, beziehungsweise Blockaden erkennen, die einer effektiven Vektorisierung im Wege stehen.

Ein neuer, praktischer Ratgeber: der Vectorization Advisor

Der neue MPI Performance Snapshot ist Teil des Trace Analyzer and Collector und hilft dabei, die MPI-Kommunikation (Message Passing Interface) zu analysieren und zu beschleunigen. In einer grafischen Oberfläche bekommen Entwickler Einblick darüber, inwiefern eine Anwendung skaliert, und einen Vergleich darüber, wie sich die Lastverteilung zwischen MPI-, OpenMP- und Anwendungscode verhält.

Parallel Studio XE 2016 gibt es in drei Ausgaben. Die Composer Edition enthält C++- und Fortran-Compiler, Performancebibliotheken und Modelle zur Parallelprogrammierung. Die Professional Edition bietet zusätzlich die neue DAAL-Bibliothek, den Vectorization Advisor, einen Performance-Profiler, ein Thread-Prototyping-Werkzeug sowie einen Memory- und Tread-Debugger. Das größte Paket, die Cluster Edition, umfasst zusätzlich die MPI-Cluster-Werkzeuge inklusive des neuen MPI Performance Snapshot.

Siehe dazu auf heise Developer:

(ane)