Das automatisierte soziale Netzwerk
Mit Hilfe neuer Algorithmen versuchen Wissenschaftler, aus Kommunikationsdaten soziale Verbindungen zwischen Personen abzuleiten. E-Mails könnten so nach Wichtigkeit vorsortiert, oder Verteiler automatisch erstellt werden. Die Idee klingt bestechend, klappt aber in der Praxis nicht immer wirklich reibungslos.
- Erica Naone
Mit Hilfe neuer Algorithmen versuchen Wissenschaftler, aus Kommunikationsmustern persönliche Verbindungen zwischen Personen abzuleiten. Das klappt nicht immer reibungslos.
Als Google vor einigen Monaten einen eigenen Microblogging-Dienst namens "Buzz" startete, gab die Firma reichlich stolz bekannt, dass es ihr dabei gelungen sei, ein automatisch generiertes soziales Netzwerk aufzubauen. Den Job erledigten Algorithmen, die das Kommunikationsverhalten der Nutzer aus den Daten anderer firmeneigener Dienste wie etwa Google Mail erschlieĂźen.
Die Kunden erfreute die Idee allerdings gar nicht – viele von ihnen empfanden die von Google erfasste Struktur als fehlerhaft, weil sie mit simplen E-Mail-Kontakten eben ganz anders umgehen wollten als mit einem sozialen Netzwerk. Der Internet-Riese musste zurückrudern und Buzz deutlich stärker auf Handbetrieb umstellen als eigentlich vorgesehen. Solche Automatismen, so zeigte sich, können im Netz sogar Schaden anrichten.
Trotz des Vorfalls, der Google einiges an Sympathien kostete, interessieren sich mittlerweile viele Firmen dafür, soziale Verbindungen zwischen Nutzern über E-Mails oder andere Kommunikationsstränge automatisiert auszulesen. Bei der IBM-Tochter Lotus wird etwa an einem Produkt namens "Atlas" gearbeitet, das aus geschäftlicher Kommunikation einen "sozialen Graphen" abbilden kann. Bei Microsoft bastelt man unterdessen an einer Technik, die es erlauben soll, E-Mail anhand "sozialen Wissens" nach ihrer wahrscheinlichen Wichtigkeit vorzusortieren.
Die mit dem Thema befassten Forschergruppen sind sich dabei durchaus bewusst, dass es noch zahlreiche ungelöste Probleme gibt, bevor Computer soziale Netze wirklich selbstständig analysieren und abbilden können. In einer Studie, die unlängst auf der "WWW2010"-Konferenz im amerikanischen Raleigh vorgestellt wurde, zeigten Wissenschaftler des Internet-Portals Yahoo, dass zunächst einmal bestimmt werden muss, wie sich eine Verbindung zwischen zwei Personen überhaupt erkennen lässt. Sind Menschen schon "Freunde", wenn sie ein paarmal E-Mails ausgetauscht haben? Oder braucht es eine bestimmte Zahl von Kontakten, bevor eine Verbindung "zählt"? "Beziehungen lassen sich mit der heutigen Technik nie direkt beobachten, sondern nur über Kommunikationsereignisse", sagt Jake Hofman, Forscher in der "Social Dynamics Group" bei Yahoo Research, die an der Studie beteiligt war. Je nach Interpretation dieser Kommunikationsereignisse bauten Algorithmen ein vollkommen anderes Bild der zu ermittelnden Sozialstruktur auf.
Trotzdem lässt sich dieser Ansatz bereits jetzt recht gut für bestimmte Anwendungen nutzen: Ein Netzwerk aus relativ selten miteinander interagierenden Kommunikationspartnern lässt sich beispielsweise für die Weitergabe öffentlich zugänglicher Neuigkeiten aus dem Web nutzen, die die gesamte Gruppe interessiert. Wer öfter kommuniziert, kann dagegen auch schon mal intimere Informationen erhalten.
"Die Schwellwerte, die wir heute für ein automatisch generiertes soziales Netzwerk setzen, sind weitgehend zufällig gewählt", räumt Lada Adamic ein, Juniorprofessorin an der School of Information der University of Michigan. Sie sieht neben den von den Yahoo-Forschern aufgeworfenen Fragen außerdem noch ganz andere Probleme. Beispielsweise definierten die meisten Algorithmen Netzwerke sehr einfach – entweder es existiert eine Verbindung oder eben nicht. Grauzonen, wie sie im echten Leben sehr häufig vorkämen, würden ausgeblendet. Algorithmen ließen sich zwar entsprechend umformulieren, doch Fehler seien nie ganz zu vermeiden, weil die Daten eben nicht das Gesamtmuster einer Beziehung erfassten. "Zwei Menschen emailen vielleicht nicht, telefonieren aber regelmäßig oder treffen sich eben persönlich."
Unvollständige Informationen könnten Versuche, Netzwerke automatisch zu generieren, stets unterminieren, glaubt auch Eric Gilbert, Experte für Social Networking, der demnächst als Juniorprofessor für interaktive Computertechnik am Georgia Institute of Technology anfängt. Besonders die intimsten Verbindungen würden durch Software selten erfasst, da diese sich persönlich statt elektronisch manifestierten. "Das ist das Ehepartner- oder auch Mitbewohner-Problem." Die Untersuchung der Struktur eines Netzwerkes in größerer Tiefe könne das zwar kompensieren - so teilt ein verheiratetes Paarwahrscheinlich eine große Anzahl von Freunden miteinander - eine vollständige Lösung des Problems seien solche Tricks aber noch nicht.
Das Gegenteil des Ehepartner-Problems ist das "Ex-Problem", das man auch schön beim Start von Google Buzz beobachten konnte. Es tritt auf, wenn der Algorithmus zwei Menschen miteinander verbindet, die früher viel kommuniziert haben, es nun aber nicht mehr tun und auch gar nicht mehr wollen. Dazu gehören ehemaligen Partner oder Kollegen. Gilbert meint, es sei sehr schwer, ein Ereignis wie das Ende einer Beziehung zu erkennen. Die Breite möglicher Variablen sei zu groß. Zwei Personen kommunizieren vielleicht nicht mehr, weil eine von ihnen beschäftigt oder im Urlaub ist. Damit so etwas festgestellt wird, müsste eine Software komplexes Verhalten von Nutzern schon über einen langen Zeitraum untersuchen – und zwar im jeweiligen Kontext bereits bekannter und verifizierter Verbindungen.
Munmun De Choudhury, die an der Yahoo-Forschungsarbeit beteiligt war und nun bei Microsoft Research arbeitet, glaubt, dass sich solche und andere Probleme allein durch bessere Algorithmen lösen lassen. Diese müssten auch Stimmungen berücksichtigen. Denn: Häufige E-Mails können sowohl eine sehr positive als auch eine sehr negative Beziehung bedeuten. Eine tiefere Analyse durch eine Textauswertungssoftware könnte hier den Durchbruch bringen.
Ob Nutzer automatisiert erstellte soziale Netzwerke akzeptieren, hängt ganz von ihrer Fehleranfälligkeit ab. In manchen Fällen arbeiten Algorithmen, die E-Mails und andere Kommunikationsspuren durchsuchen, bereits ziemlich gut. Sie helfen dann dabei, Zeit zu sparen, weil sie einen Überblick über bestehende Verbindungen liefern oder Informationen filtern. "Die Maschine darf daraus aber nicht zu viel ableiten und so sehr ins Detail gehen, dass es unheimlich wird", warnt Gilbert.
Dabei sei es wichtig, dass Nutzer Fehler bei allen Automatismen schnell bereinigen können. Der Mensch greift der Maschine unter die Arme. "Es gibt ja immer noch die Möglichkeit, den User zu fragen. Ein Algorithmus kann dann eine Genauigkeit von 95 Prozent erreichen, der Nutzer die restlichen 5 Prozent übernehmen", meint Expertin Adamic.
(bsc)