Twitter publiziert Empfehlungsalgorithmus – mit Sonderregeln für Elon Musk

Twitter hat Teile des Codes für die algorithmische Timeline-Steuerung als Open Source veröffentlicht. Beiträge von Elon Musk werden demnach speziell behandelt.

46

(Bild: InFootage.com/Shutterstock.com)

01.04.2023, 16:51 Uhr

Lesezeit: 6 Min.

Von

Stefan Krempl

Twitter publiziert Empfehlungsalgorithmus – mit Sonderregeln für Elon Musk

Teile des Quelltextes von Twitter sind seit Freitag als Open Source verfügbar und können so von der interessierten Öffentlichkeit inspiziert werden. Das Entwicklerteam des sozialen Netzwerks hat dazu zwei Verzeichnisse auf der Plattform GitHub unter der GNU Affero General Public License (AGPL) veröffentlicht, die Code für viele wichtige Komponenten enthalten, die Twitter prägen. Dazu gehören entscheidende Bausteine für den Algorithmus, mit dem der Betreiber die Tweets auswählt, die Nutzer ohne Änderungen der Voreinstellungen auf ihrer Timeline sehen.

"Dies ist der größte Teil des Empfehlungscodes", schrieb Twitter-Chef Elon Musk in einem Beitrag auf dem Kurznachrichten-Dienst. "In den kommenden Wochen werden wir buchstäblich alles, was zur Anzeige eines Tweets beiträgt, als Open Source herausgeben, sodass die Ergebnisse zumindest grob eingeschätzt werden können."

Transparenz angekündigt – aber nicht bei Werbung und Sicherheit

"Bei dieser Veröffentlichung haben wir uns um ein Höchstmaß an Transparenz bemüht", heißt es bei Twitter selbst in einem Blogbeitrag. Man habe Quelltext zurückgehalten, der die Sicherheit oder die Privatsphäre der Nutzer beeinträchtigen könnte. Dies gelte auch für Funktionen rund um die Fähigkeit, die Plattform "vor böswilligen Akteuren zu schützen". Der Kampf gegen die sexuelle Ausbeutung von Kindern und gegen Manipulation dürfe nicht unterwandert werden. Zudem fehlen die Teile, die für Werbeempfehlungen zuständig sind. Auch Daten, die für das Training der Algorithmen verwendet werden, sind nicht enthalten.

Videos by heise

"Wir hoffen, von der kollektiven Intelligenz und dem Fachwissen der weltweiten Community zu profitieren", unterstrich Musk. Diese könnten helfen, "Probleme zu finden". Der Plattforminhaber setzt so auf Vorschläge für Verbesserungen, "die am Ende zu einem besseren Twitter führen". Er kündigte an, dass der Algorithmus auf Basis von Benutzervorschlägen künftig alle 24 bis 48 Stunden aktualisiert werden solle.

Sonderregeln für "Elon" und die Politik

Ersten Begutachtern des Codes für den Empfehlungsalgorithmus fiel rasch auf, dass dieser buchstäblich Sonderregeln für die Behandlung von Musks Beiträgen etwa mit der speziellen Variable "author_is_elon" enthält. Die Programmroutine markiert demnach Tweets von Musk automatisch. Was genau mit diesem Label passiert, blieb zunächst unklar. Zuvor hatte das US-Magazin "Platformer" berichtet, dass der Twitter-CEO seine Tweets sichtbarer machen und dafür Einfluss auf den Algorithmus nehmen wollte. Dieser sollte demnach so "frisiert" werden, dass die Tweets des Eigentümers regelmäßig die höchste Reichweite erzielen. Die Bayerische Landeszentrale für neue Medien (BLM) prüft, ob dieser "Booster" tatsächlich implementiert wurde und gegebenenfalls gegen den Medienstaatsvertrag der Länder verstößt.

Erkennbar sind zudem Labels unter anderem für Demokraten, Republikaner und "Power-User". Musk zeigte sich darüber überrascht: Er habe dies gerade erst in Erfahrung gebracht. Dieser Schrott werde direkt gelöscht. Tatsächlich gibt es schon einen Eintrag auf GitHub, dass erste Quelltextzeilen entfernt wurden. Zuvor hatte der Unternehmer Twitter bereits als "brennendes Flugzeug ohne Steuerung" bezeichnet. Die Forscherin Jane Manchun Wong verwies auch darauf, dass der Code unter anderem die Accounts von Twitter-Erfinder Jack Dorsey, Pop-Star Katy Perry und Ex-US-Präsident Barack Obama als "Testkonten" behandle. Tweets von diesen Nutzern würden zufällig ausgewählt und ihre Leistung verfolgt. Diese Funktion werde inzwischen aber verborgen.

In einer Diskussionsrunde auf Twitter räumte Musk ein: Die erste Veröffentlichung "wird ziemlich peinlich sein, und die Leute werden eine Menge Fehler finden, aber wir werden sie sehr schnell beheben". Die versprochene Transparenz habe viel Gutes: "Selbst wenn man mit etwas nicht einverstanden ist, weiß man zumindest, warum es da ist, und dass man nicht heimlich manipuliert wird". Das Team folge dem "großartigen Beispiel von Linux als Open-Source-Betriebssystem": Auch dort sei es theoretisch einfach, viele Sicherheitslücken zu entdecken. In der Realität sei es aber so, "dass die Community diese Schwachstellen identifiziert und behebt".

"Social Graph"

Wie Twitter in einer technischen Beschreibung ausführt, sind mehrere neuronale Netze mit mehreren Millionen von Parametern für das Einstufen der Tweets und die Empfehlung von Konten zuständig, denen man folgen sollte. Ein Filter blendet Tweets aus, um nationale Gesetze zu befolgen, "die Produktqualität zu verbessern, das Vertrauen der Nutzer zu stärken" und die Einnahmen zu schützen.

"Wir versuchen, die besten 1500 Tweets aus einem Pool von Hunderten von Millionen zu extrahieren", erklären die Entwickler. Heute bestehe die voreingestellte Timeline im Durchschnitt jeweils aus 50 Prozent Tweets von Followern und von Leuten, denen man nicht folgt. Das Verhältnis variiere aber bei einzelnen Mitgliedern. "Nach der Ranking-Phase wenden wir Heuristiken und Filter an, um verschiedene Produktmerkmale zu implementieren", geht aus der Beschreibung des "Social Graph" des Netzwerks rund um die erstellten Beziehungen weiter hervor. Dazu gehörten Faktoren wie "Autorenvielfalt", "Ausgewogenheit der Inhalte" und "Feedback-basiertes Zurücknehmen (fatigue)". So wird etwa die Punktzahl bestimmter Tweets gesenkt, wenn der Betrachter eine negative Rückmeldung dazu abgegeben hat.

Teile des Quelltextes von Twitter waren jüngst bereits ungewollt infolge eines schwerwiegenden Datenleaks auf GitHub offen im Internet einsehbar. Dagegen geht der Betreiber vor. Hier bestand die Sorge, dass auch Komponenten enthalten gewesen sein könnten, die die Sicherheit und den Manipulationsschutz des Dienstes gefährden könnten. Twitter entließ erst vor wenigen Wochen einen Großteil seiner Mitarbeiter in den Bereichen Ethik für Künstliche Intelligenz (KI) und Vertrauensbildung, die auch für die Moderation von Inhalten zuständig waren. Kritiker monieren daher, dass der Code wohl auch veröffentlicht werde mit der Erwartung, die Allgemeinheit werde nun die Arbeit der Gefeuerten übernehmen.