Federated Learning Of Cohorts: Personalisierte Werbung ohne Nutzerprofile

Mit einer neuen Technik will Google die Quadratur des Kreises schaffen: Cookiefreies und dennoch akkurates Werben. Basis sind dann Kohorten.

In Pocket speichern vorlesen Druckansicht 22 Kommentare lesen

Interessensgruppen statt Cookies: So schaut Googles Plan für die Online-Werbung aus.

(Bild: Anton Watman/Shutterstock.com)

Lesezeit: 5 Min.
Von
  • Torsten Kleinz
Inhaltsverzeichnis

Googles Vorbereitungen auf die Abschaffung des Third Party Cookies nehmen mehr Gestalt an. In einem Whitepaper hat der Konzern eine neue Technik vorgestellt, die das personalisierte Werben revolutionieren soll: Mit Federated Learning of Cohorts (FLoC) sollen Werber Interessenprofile nutzen können, ohne dass diese Informationen das Gerät des Nutzers verlassen.

Anfang des Jahres hatte Google das Ende der Third Party Cookies zu Werbezwecken innerhalb von zwei Jahren angekündigt. Mit der Initiative "Privacy Sandbox" stellt der Konzern seither Techniken wie Turtledove vor. Das Ziel: Während die Browser-Konkurrenz Werbung und Tracking zunehmend blockiert, will Google neue Alternativen schaffen, die einen Kompromiss zwischen Privatsphäre der Nutzer und dem Datenhunger der Werbetreibenden herstellen.

Nun hat Google ein Whitepaper auf Github veröffentlicht, das das Konzept vorstellt. Der Kerngedanke: Die Endnutzer werden bestimmten "Kohorten" zugeteilt, die einem gemeinsamen Nutzerprofil angehören. Werbetreibende können dann ihre geplanten Werbekampagnen diesen Kohorten zuordnen, sodass sie an Nutzer mit einem passenden Interessenprofil ausgeliefert werden. "Wir wollen Privatsphäre-freundliche Mechanismen zur Verfügung stellen, die es den Werbenden ermöglichen, ihre Werbung zu personalisieren, ohne die Nutzer zu identifizieren oder tracken zu müssen."

Der Clou des Federated Learning: Um diese Interessen-Kohorten zu erstellen, ist es nicht notwendig, die Interessenprofile der Nutzer zentral zu sammeln. Stattdessen sollen Algorithmen auf dem Endgerät etwa aus der Browser-Historie Hashwerte berechnen, die eine Zuordnung zu einer solchen Gruppe ermöglichen. Dabei wird die Technik SimHash eingesetzt.

Damit die Kohorten nicht nachträglich wieder konkreten Personen zugeordnet werden können, hat sich Google gegen die "Differential Privacy" entschieden, die etwa bei der Datenaufbereitung von Bewegungsdaten in Google-Produkten zum Zug kommt und die darauf beruht, die Daten im Einzelnen zu verrauschen, ohne das Gesamtergebnis zu beeinflussen. Stattdessen setzt FloC auf k-Anonymität, bei der Nutzer in so große Kohorten eingeteilt werden, bis keine Rückschlüsse auf einzelne Nutzer mehr möglich sind. Im Whitepaper ist etwa die Zahl von 5000 Nutzern genannt, die zu hinreichend ähnlichen Interessenprofilen gruppiert werden.

Um die Funktionsfähigkeit des Modells zu beweisen, nutzten Google-Forscher zunächst Musik- und Filmdatenbanken mit Nutzerfeedback, um diese Nutzer gemäß dem FloC-Prinzip zu gruppieren. Als nächsten Schritt nutzten sie Realdaten aus Googles Werbenetzwerk, um die Kohorten für Werbeprofile zu bilden. Erste Testläufe ergaben dabei eine hohe Wirksamkeit und Akkuratesse der Werbeausspielungen.

Um das Werbemodell privatsphärefreundlich umzusetzen soll diese Interessen-Gruppierung künftig direkt auf dem Gerät geschehen. Hierzu werden die besuchten Domains und die Art der abgerufenen Inhalte ausgewertet. Das zum Abschluss generierte Kohorten-Profil wird dann den klassischen Kategorien der Werbeplanung zugeordnet. Die Auswertung soll so gerätezentriert sein, dass etwa dem Desktop-Rechner und dem Mobiltelefon desselben Nutzers mitunter unterschiedliche Kategorien-IDs zugeordnet werden.

Google will mit der Veröffentlichung des Whitepaper eine Diskussion unter anderem in der Standardisierungsorganisation W3C in Gang bringen – eine konkrete Implementation gibt es noch nicht. Gegenüber heise online zeigt sich Dr. Lukasz Olejnik, Forscher und Consultant zu Fragen der Privatsphäre, vorsichtig optimistisch. "K-Anonymität ist ein valider Ansatz zum Schutz der Privatsphäre", erklärt Olejnik. "Letztlich kommt es darauf an, wie das Prinzip in der Praxis eingesetzt wird, insbesondere wie groß K im Vergleich zu der adressierten Gesamtpopulation ist."

Das FLoC-Prinzip taugt wohlgemerkt nicht zur Ablösung des gesamten Online-Werbemarktes. So sind Retargeting-Kampagnen mittels der Kohorten nicht möglich. Deshalb ist FloC nur ein Baustein in der "Privacy Sandbox"-Initiative von Google. Neben der reinen Werbeausspielung geht es auch darum, den Werbetreibenden Daten über den Erfolg von Werbung und zum Schutz gegen betrügerischen Bot-Traffic zur Verfügung zu stellen.

Ob die Industrie auf die Angebote anspringt, steht aber noch in den Sternen. Zwar wird die Diskussion innerhalb des W3C, das in den letzten Monaten viele neue Mitglieder zu verzeichnen hatte, als konstruktiv beschrieben. Gleichzeitig bemühen sich aber viele Industrie-Player darum, das alte programmatische Geschäftsmodell ohne größere Anpassungen an eine Welt ohne Third Party-Cookies anzupassen. Auch Google hat bereits damit begonnen, First Party Cookies auf Websites anderer Anbieter zum Tracking einzusetzen.

Olejnik wirbt dafür, sich nicht auf Umwege und technische Tricks zu verlassen. "Googles aktuelle Vorschläge sollten nicht mit dem aktuellen Status Quo verglichen werden, sondern mit einer Welt ohne Zugriff auf Third Party Cookies, also dem künftigen Status Quo." Denn neben den Initiativen von Apple und Mozilla sehen sich auch staatliche Regulatoren mittlerweile in der Pflicht, den Werbemarkt neu zu ordnen.

Lesen Sie auch

(emw)