Manipulation per Twitter

Man kann auch wildfremde Nutzer dazu bekommen, Nachrichten weiterzuleiten - mit Hilfe eines Maschinenlernalgorithmus. Marketingkampagnen, Wahlkämpfer und Medien dürfte das freuen.

30.05.2014, 06:00 Uhr

Lesezeit: 5 Min.

MIT Technology Review

Von

TR Online

Man kann auch wildfremde Nutzer dazu bekommen, Nachrichten weiterzuleiten - mit Hilfe eines Maschinenlernalgorithmus. Marketingkampagnen, Wahlkämpfer und Medien dürfte das freuen.

Wenn man eine fremde Person darum bittet, einen Tweet zu retweeten, ist die Wahrscheinlichkeit nicht sehr hoch, dass sie das auch tut. Adressieren Sie mit derselben Nachricht sehr viele Twitter-Nutzer, verbreiten einige sie vielleicht tatsächlich weiter. Was aber bringt diese Leute dazu, Informationen einer ihnen unbekannten Person zu retweeten?

Diese Frage hat sich Kyumin Lee von der Utah State University zusammen mit Freunden am IBM Almaden Research Center gestellt. Ihre erstaunliche Antwort: Studiert man die Eigenarten von Twitter-Nutzern, lassen sich einige identifizieren, die mit größerer Wahrscheinlichkeit als andere auch Tweets von Fremden weiterleiten. Die Informatiker um Lee machten die Probe aufs Exempel und siehe da: Sie konnten die Retweet-Rate von Nachrichten an Fremde um bis zu 680 Prozent erhöhen.

Wie funktioniert das konkret? Das Verfahren baut auf der Annahme auf, dass manche Twitter-Nutzer zu bestimmten Themen und Tageszeiten mit höherer Wahrscheinlichkeit Kurznachrichten verschicken. Um diese Personen zu identifizieren, wird zunächst ein Profil diverser Nutzer erstellt, ihres Tweet-Verhaltens der letzten Zeit, um brauchbare Anhaltspunkte zu finden.

Was theoretisch erst einmal simpel klingt, ist in der Praxis ein wenig aufwendiger. Lee und Kollegen testeten zwei Arten von Informationen: Lokalnachrichten aus San Francisco und Mitteilungen zur Vogelgrippe, die zur Zeit ihres Projekts in den Medien Thema war. Sie legten dazu verschiedene Twitter-Konten an, die jeweils ein paar Follower hatten, um die Testnachrichten zu verschicken.

Als potenzielle Adressaten der Lokalnachrichten stellten sie eine Gruppe von 34.000 Nutzern zusammen, die sich selbst in der San Francisco Bay Area verortet haben. Aus denen wählten sie nach dem Zufallsprinzip 1900 Personen aus. Die bekamen dann eine einzige Nachricht der folgenden Art:

”@ SFtargetuser 'Ein Mann bei Schusswechsel getötet, drei Verletzte… http://bit.ly/KOl2sC' Bitte RT diesen Sicherheitshinweis”

Der Test-Tweet enthielt also den Namen des Nutzers, eine kurze Überschrift, einen Link zu einem Medienbericht und die Aufforderung, die Nachricht weiterzuleiten. Von den 1900 Adressaten taten dies tatsächlich 52, das sind 2,8 Prozent.

Für den Tweet zur Vogelgrippe suchten Lee und Kollegen Nutzer, die bereits selbst über die Krankheit getwittert hatten. Sie kamen auf 13.000 Personen, von denen sie wiederum 1900 nach dem Zufallsprinzip auswählten. 155 schickten den Test-Tweet weiter – immerhin 8,4 Prozent.

Das ist aber noch nicht alles. Die Wissenschaftler gingen in eine zweite Runde, um das Verfahren zu verfeinern. Sie suchten noch zu beiden Gruppen potenzieller Adressaten zusätzliche Informationen heraus, allesamt öffentlich zugänglich. Für jeden einzelnen wurde das Twitter-Profil erfasst, die Anzahl der Follower und der Personen, denen sie folgen, sowie die 200 letzten Tweets. Ebenfalls notiert wurde, ob die Personen die erste Test-Nachricht weitergeleitet hatten.

Auf diesen Datensatz wandten sie nun einen Maschinenlernalgorithmus an, der eine Wahrscheinlichkeit ausspucken sollte, mit der ein Nutzer eine Nachricht retweeten würde. Dafür schauten sie nach Korrelationen zwischen dem Retweeten und der Twitter-Zugehörigkeit, dem Verhältnis von Freunden zu Followern sowie positiven und negativen Wörtern in Nachrichten. Auch die Tageszeit der Twitter-Aktivitäten wurde in Betracht gezogen. Mit diesen Korrelationen fütterten sie den Maschinenlernalgorithmus.

Das überraschende Ergebnis des zweiten Tests: Die Anzahl der Retweets nahm zu, wenn die Gruppe der Adressaten mit Hilfe des Algorithmus ausgewählt wurde. In der leiteten nun 13,6 Prozent die Lokalnachricht weiter. Zum Vergleich: In der Zufallsgruppe waren es nur 2,8 Prozent gewesen.

Wurden die Test-Tweets auch noch auf die Tageszeit abgestimmt, in der ein Empfänger besonders aktiv ist, stieg die Quote noch einmal: auf 19,3 Prozent. Das ist gegenüber dem Ausgangswert eine Steigerung von fast 600 Prozent.

Bei der Nachricht zur Vogelgrippe ergab sich ein ähnliches Bild. Hier stieg die Weiterleitungsrate von 8,3 auf 19,7 Prozent, wenn der Algorithmus die Empfängergruppe bestimmte.

Die Ergebnisse von Lee und seinen Kollegen sind mehr als neugierige Spielerei – politische Organisationen, Marketingkampagnen und Medien dürften bei diesen Zuwachsraten sehr hellhörig werden.

Die Frage ist nun, inwiefern sich das Verfahren umfassender anwenden lässt. Denkbar wäre eine App, in die man einfach ein Thema eingibt, zu dem die App dann eine Gruppe potenzieller Adressaten ermittelt, die innerhalb der folgenden Stunden mit höherer Wahrscheinlichkeit als andere eine Nachricht weiterleiten. Die Gruppe um Lee hat bislang keine derartigen Pläne geäußert. Aber wenn sie die Idee nicht umsetzt, wird es mit ziemlicher Sicherheit schon bald jemand anderes tun.

Das Paper:

Lee, K. et al.: „Who Will Retweet This? Automatically Identifying and Engaging Strangers on Twitter to Spread Information“, arXiv.org, 15.5.2014 ()