HPE Swarm Learning: verteiltes Machine Learning auf der Permissioned Blockchain

Swarm Learning ermöglicht das Trainieren von KI-Modellen, ohne personenbezogene Daten zusammenzuführen. Erste Use Cases gibt es in der medizinischen Diagnostik.

In Pocket speichern vorlesen Druckansicht 2 Kommentare lesen
Schwarm, Vögel
Lesezeit: 4 Min.
Inhaltsverzeichnis

Hewlett Packard Enterprise (HPE) hat HPE Swarm Learning veröffentlicht, ein neues Machine Learning Framework, das auf Edge Computing und verteilte Systeme ausgerichtet ist. Anwender trainieren dabei Modelle mit ihren realen Daten lokal oder in der Netzwerkperipherie und teilen anstelle der Daten die ausgelernten Modelle.

HPE verspricht dadurch einen besseren Schutz von Daten und Privatsphäre, da keine personenbezogenen Daten geteilt würden. Auch sollen die Datensätze durch das Training an der Edge weniger Bias enthalten, da das Training mit realen Daten stattfindet, wie der Blogeintrag zur Ankündigung verrät. Eine Permissioned Blockchain regelt bei HPE Swarm Learning die Zugriffsrechte und die Teilhabe an den Modellen.

Mit dem Swarm-Learning-Ansatz für das Trainieren von KI-Modellen adressiert HPE vor allem Probleme mit verteilten Daten. Justin Hotard, Executive Vice President für High Performance Computing und KI bei HPE, berichtete, dass heutzutage zwar überall Daten gesammelt würden, doch gerade beim Transfer aus lokalen Speichern oder der Edge in Cloud und zentrale Rechenzentren Compliance-Probleme entstünden – insbesondere, wenn Teams KI-Modelle mit gepoolten Daten trainieren.

Gerade das datenschutzkonforme Transferieren von Daten verursache dabei hohe Kosten. Swarm Learning soll das Problem lösen, indem Daten für Machine-Learning-Prozesse am Ort des Sammelns zum Einsatz kommen und nur die verarbeiteten Modelle ohne Rückschlüsse auf die zugrunde liegenden Daten geteilt werden.

Visualisierung des Swarm-Learning-Modells

(Bild: Hewlett Packard Enterprise)

HPE Swarm Learning wird über Container und ein Web-User-Interface bereitgestellt. Die Nutzung erfolgt ebenfalls über das Web-UI oder über ein Command-Line-Interface. HPEs Swarm-Learning-Library ist eine reine Softwareanwendung und dadurch Hardware-agnostisch. Es bestehen Schnittstellen zu TensorFlow und PyTorch. Das Verwenden eines Peer-to-Peer-Netzwerks in Form einer Permissioned Blockchain macht laut den Swarm-Leraning-Entwicklern eine zentrale Überwachungsinstanz unnötig. Über die Blockchain lassen sich HPE zufolge Mitglieder hinzufügen, dynamisch Projektleiter wählen und Modellparameter zusammenfügen, sodass Sicherheit und Resilienz für das Schwarmnetzwerk entstehen.

HPE Swarm Learning Tech Stack

(Bild: Hewlett Packard Enterprise)

Forscher setzten das Schwarmlernmodell in Kooperation mit HPE bereits in mehreren Anwendungsfeldern in der Medizin ein, die zu zwei nature-Artikeln führten. Im ersten Fall wurde das Modell zur Vorhersage von Leukämie und zur Identifikation von Tuberkulose verwendet. Auf der Pressekonferenz stellte HPE den zweiten Use Case vor, bei dem das Universitätsklinikum der RWTH Aachen zusammen mit je einem Krankenhaus in Irland und in den USA ein Modell zur Diagnose von Darmkrebs entwickelt hatte. Im Vergleich zu zwei lokal in England entwickelten Diagnose-Modellen wies die Schwarm-KI aus Deutschland, Irland und den USA eine bessere Performance vor. Die Wissenschaftler sehen die Leistung ihres Schwarmmodells auf einem Niveau mit KI-Modellen, die mit gemischten Datensätzen trainiert werden.

Anwendungsbeispiel an der Universität Aachen

(Bild: Hewlett Packard Enterprise)

Im Zuge des Veröffentlichens von HPE Swarm Learning blieben an den Punkten, die als großer Vorteil genannt worden waren, Fragen offen. Auf der einen Seite ist fraglich, ob an der Edge trainierte Modelle wirklich weniger Bias aufweisen als solche aus gepoolten Daten. Auch das Erfassen vor Ort könnte bereits durch strukturelle Benachteiligung ungenau sein, die sich dann ebenfalls in den Modellen niederschlüge. Auf der anderen Seite steht der Datenschutzaspekt: Müssten Patienten oder Kunden nicht ebenfalls der Weitergabe von auf ihren Daten trainierten Modellen zustimmen, und an welcher Stelle ist die Verwendung der Daten geregelt? HPE hatte bis Redaktionsschluss noch nicht auf eine iX-Anfrage dazu reagiert.

Im Zuge der Pressekonferenz zu HPE Swarm Learning gab Hewlett Packard auch das Release von HPE Machine Learning Development bekannt, einer neuen Hard- und Software-Plattform für Hochleistungs-Machine-Learning. Weitere Informationen zu HPE Swarm Learning finden sich auf der offiziellen Produktwebseite. Das Konzept von Swarm Learning erklärt HPE in einem Video.

(pst)