Digg wird schlauer

Dank eines neuen Empfehlungssystems soll die bekannte Linksammelstelle intelligenter arbeiten - mit ein bisschen Hilfe durch die Weisheit der Massen.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 6 Min.
Von
  • Erica Naone

Digg, die populäre "Social Bookmarking"-Website, begann Anfang Juli damit, ein neues Empfehlungssystem in Betrieb zu nehmen. Der verwendete Ansatz ist im Vergleich zu dem, den E-Commerce-Firmen wie Amazon propagieren, allerdings ein ganz anderer: Während diese Websites die notwendigen Daten aus einem Mix aus Einkaufs- und Browsing-Historie sowie Informationen über den Verkaufsgegenstand selbst beziehen, setzt Digg voll auf das, was das Angebot in den letzten Jahren groß gemacht hat – die Weisheit der Massen.

Der Dienst hat einen guten Ruf zu verlieren, was das Auffinden interessanter Neuigkeiten aus der Flut frischer Informationen anbetrifft, die ständig durchs Internet fließen. Nutzer reichen interessante Nachrichten samt Link ein und andere Nutzer können diejenigen, die ihnen gefallen, dann "diggen" oder sie auch "begraben", falls sie ihnen uninteressant erscheinen sollten. Die populärsten Geschichten landen wiederum auf der Homepage von Digg, die jeder sieht.

Seit dem Start 2004 wuchs das Angebot stark, was zu ernsthaften Problemen für die Nutzer und die Seite selbst geführt hat. Es ist inzwischen selbst für interessierte Benutzer nahezu unmöglich, die mehr als 15.000 Geschichten zu sichten, die jeden Tag bei Digg eingereicht werden. Das bedeutet auch, dass viele User gar nicht oder nur wenig an der Abstimmung teilnehmen, die darüber entscheidet, was auf der Startseite landet. Anton Kast, Chefwissenschaftler bei Digg, hofft nun, dass das neue Empfehlungssystem das Problem lösen kann. Durch das Hervorheben solcher Geschichten, die ein Nutzer mögen könnte, soll es für ihn leichter werden, die Menge an eingereichtem Material zu bewerten. "Man bekommt das zu sehen, was einen interessiert und kann dann auf eine Art beitragen, die wesentlich effizienter ist als vorher", meint Kast.

Der Charakter von Digg bedingt aber, dass die Firma ihr Empfehlungssystem eher unkonventionell aufbauen muss. "Wir haben es hier nicht mit einem magischen Orakel zu tun. Wir wollen auch nicht behaupten, dass der Computer schlauer wäre als der Nutzer, oder dass wir genau wissen würden, was der Nutzer will." Statt die Charakteristika der einzelnen Artikel zu nutzen, um den Hauptalgorithmus des Empfehlungssystems zu füttern, basiert Diggs Ansatz deshalb vollständig auf der Berechnung der Verbindungen zwischen seinen Nutzern.

Und das funktioniert so: Jedes Mal, wenn ein User eine Geschichte diggt, vergleicht das System diese Aktion mit den Aktionen jedes anderen Users im System und findet dann heraus, welche die meisten Diggs gemeinsam haben. Damit die Empfehlungen nicht so stark ausschlagen, berechnet das System diese Verbindungen für jedes Thema einzeln, da zwei Benutzer, die ein Interesse an Videospielen teilen, nicht unbedingt die gleichen politischen Themen mögen müssen. Um die Empfehlungen zudem facettenreich werden zu lassen, zeigt das System immer nur eine bestimmte Anzahl an Geschichten jedes kompatiblen Benutzers.

Außerdem wird auch eine bestimmte Quote an Neuigkeiten angezeigt, die von Nutzern stammen, die weniger kompatibel sind. Das Empfehlungssystem schränkt außerdem die Auswirkungen ein, die ein einzelner Digg haben kann. Jemand, der eine sehr populäre Geschichte diggt, wird also nicht gleich mit Tausenden anderen Nutzern in Verbindung gesetzt. Weil das System all diese Wechselbeziehungen in Echtzeit berechnen kann und dazu eigene Server verwendet, soll jede Entscheidung das Empfehlungssystem bereits innerhalb von unter zwei Minuten beeinflussen.

Paul Lamere, Ingenieur beim "Search Inside the Music"-Empfehlungsprojekt des IT-Konzerns Sun Microsystems, meint, dass ein Empfehlungssystem, das mit großen Mengen an Informationen müsse, ein komplexes Stück Arbeit sei. Diggs Eigenheiten machten das Problem aber etwas leichter. Im Gegensatz zu einem System wie bei Amazon, bei dem die Anzahl der Objekte in der Datenbank stetig wächst, schränkt Digg die Datensätze für seine Empfehlungsmaschine auf die letzten 30 Tage ein. Das spart Speicherplatz. Hilfreich ist außerdem die Unterteilung nach Themen, weil es die Menge an Verbindungen, die gleichzeitig bearbeitet werden muss, reduziert. Dadurch, dass die Empfehlungen jedoch nur auf Nutzern basieren statt auf einzelnen Artikeln, existiert stets das Risiko, dass die Vielfalt verloren geht, kritisiert Lamere. "Es ist ein Die-Reichen-werden-reicher-Phänomen." Ergo: Empfehlungssysteme, die den tatsächlichen Charakter einzelner Artikel einberechnen, können auch weniger oft bewertete Artikel nach vorne bringen.

Obwohl die Digg-Empfehlungsmaschine bereits für alle User nutzbar ist, bleibt sie doch ein Experiment. Dennoch habe sie bereits erste Auswirkungen darauf, wie die Seite arbeitet, sagt Kast. "Das Diggen hat stark zugenommen und auch die Anzahl einzelner Nutzer, die diggen." Die Firma hoffe nun, dass das sich die Gesamtqualität des Angebots erhöhe. Wenn mehr Nutzer frühzeitig bei der Auswahl helfen, dürften auch diejenigen Digg-Algorithmen besseres Zahlenmaterial erhalten, mit denen Geschichten auf der Startseite landen.

John Riedl, Professor für Computerwissenschaften an der University of Minnesota, der selbst Empfehlungssysteme erforscht, hält Diggs Vorstoß für interessant, weil er einen anderen Charakter als die Ansätze im Bereich E-Commerce habe. Shopping-Seiten müssten mit Trends umgehen, die Wochen oder Monate andauerten. Im Nachrichtengeschäft gehe es hingegen um Stunden. Der Zeitdruck mache es besonders schwer, ein System zu erstellen, das Geschichten auswähle, die sowohl neu als qualitativ hochwertig seien.

Dennoch ist Diggs Schritt Teil des Umbruches, der derzeit im Bereich der Informationsverteilung erfolgt, glaubt der Experte. "Ich würde Informationen gerne öfter aus dem Grund verteilt wissen, dass es Dinge sind, die einzelne Personen besonders stark interessieren. Unser Geschmack und unsere Eigenarten als Menschen sind das, was zählt." Er wisse nicht, ob das Digg nun schon gelungen sei. Der Versuch an sich sei jedoch schon einmal gut. (bsc)