Machine Learning: Wie Federated Learning KI und Datenschutz vereint

Federated Learning als Kompromiss für Unternehmen, die ihre Daten schützen, aber trotzdem für das Training eines Machine-Learning-Modells einsetzen wollen.

Artikel verschenken

12.07.2023, 15:15 Uhr

Lesezeit: 12 Min.

iX Magazin

Von

Oliver Bracht

Machine Learning: Wie Federated Learning KI und Datenschutz vereint
- Modelle statt Daten zusammenführen
Vom MRT bis zur Maschinensteuerung
Privacy, Partitionierung und Aggregation
Die wichtigsten Federated-Learning-Frameworks im Überblick

Bei der Entwicklung von Machine-Learning-Modellen kann man sich durchaus auf das Prinzip "Viel hilft viel" verlassen. Qualität und Güte von Algorithmen sind untrennbar mit der verfügbaren Menge relevanter Daten verbunden. Big-Tech-Unternehmen sind in der komfortablen Situation, dass sie über ausreichend Daten ihrer Nutzer verfügen und sich die Möglichkeit gesichert haben, sie zum Modelltraining zu nutzen. Anders sieht die Situation bei klassischen Unternehmen aus, insbesondere im B2B-Umfeld. Dort sind es üblicherweise nicht die KI-Anbieter selbst, die Daten erheben und sammeln, sondern Anwenderunternehmen – zum Beispiel im Maschinenbau, wo sie aus der verbauten Sensorik stammen. Um mit diesen Daten Modelle zu trainieren, gibt es zwei Optionen: Entweder trainiert der Modellanbieter ein zentrales Modell mit allen Daten oder die Anwender trainieren dezentrale und unabhängige Modelle direkt vor Ort.

Im ersten Fall übergeben die Anwenderunternehmen die Daten an den Hersteller, der sie zentral sammelt, ein KI-Modell darauf trainiert und es dann den Anwendungsunternehmen bereitstellt. Das Modell lernt hier über alle Anwender. Unternehmen geben ihre Daten allerdings prinzipiell ungern weiter, denn sie fürchten, dass sie damit sensible Informationen wie Produktionsprozesse oder geistiges Eigentum preisgeben könnten.

Die Alternative besteht darin, dass jedes Anwenderunternehmen ein eigenes Modell erstellt. Damit sind die Datenschutz- und Datensicherheitsbedenken gelöst, allerdings ist die Güte der Modelle wesentlich schlechter als bei einem Modell, das auf alle Daten Zugriff hat. Das gilt insbesondere dann, wenn es darum geht, Ereignisse wie beispielsweise Maschinenstörungen zu prognostizieren. Problematische Verläufe bilden hier eine starke Minorität – es handelt sich um sogenannte Rare Events. Bei einer begrenzten Datenbasis ist das Training eines Prognosemodells dadurch erheblich schwerer und belastbare Ergebnisse bleiben komplett aus oder treten erst mit großem zeitlichen Vorlauf ein.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Fritzbox 5690 Pro im Test: AVMs erster Router mit DSL- und Glasfasermodem

Mit der Fritzbox 5690 Pro setzt AVM den Umstieg seiner Router auf Wi-Fi-7-WLAN fort. Im Test zeigt sich: Die Box hat Lücken, aber auch Wumms.

Mit der Baureihe G60 bietet BMW den 5er erstmals auch als reines Elektroauto an.

UpdateWas 100 Kilometer mit dem Elektroauto wirklich kosten

Wer die Fahrtkosten auf den Verbrauch reduziert, unterschlägt den größten Teil der tatsächlichen Ausgaben. Das zeigt der Vergleich von zwölf Modellen.

Fahrbericht Dacia Spring: Noch immer billig oder nun preiswert?

Dacia hat das günstigste E-Auto eines Großserienherstellers gründlich überarbeitet. Wo gibt es Fortschritte und an welchen Stellen wird das Spardiktat spürbar?

Rückgang von THG-Prämien: Betrügereien auf Kosten von E-Auto-Besitzern

Wer abgasfrei mit dem E-Auto fährt, profitiert von CO2-Ausgleichszahlungen der Mineralölkonzerne. Die Höhe der jährlich ausgeschütteten THG-Prämie fällt jedoch.

Apple Vision Pro versus Quest 3: Duell zum Deutschlandstart

Die Apple Vision Pro soll die Quest 3 in Deutschland ausstechen, doch diese hat viel dazugelernt. Ein Vergleich der Vor- und Nachteile in Mixed Reality.

Fritzbox 7690 im Test: AVMs schneller DSL-Router mit Wi-Fi 7

AVMs Fritzbox 7690 bietet schnelles Wi-Fi-7-WLAN und bringt das Internet per Telefonleitung ins Haus.

nach oben

Alle Angebote

Newsletter heise-Bot Push Push-Nachrichten

${intro} ${title}