Google forscht an Ranking nach Webseiten-Wahrheitsgehalt
Ein Team von Google-Forschern will herausfinden, wie sich die Vertrauenswürdigkeit automatisiert abschätzen lässt und wie relevant das Ergebnis fürs Suchmaschinen-Ranking sein kann.
Ein Forscher-Team von Google beschäftigt derzeit sich mit der Frage, ob der Wahrheitsgehalt von Webseiten in deren Suchmaschinen-Ranking einfließen könnte. Erste Ergebnisse eines synthetischen Tests hat das Team nun in einem Bericht zur Verfügung gestellt und mit dem traditionellen Pagerank-Algorithmus der Google-Gründer Sergey Brin und Larry Page verglichen.
Für den Test stellten die Forscher eine Datenbank mit 2,8 Milliarden Fakten zusammen. Diese habe als Basis gedient, mit erarbeiteten Algorithmen den Wahrheitsgehalt von 119 Millionen Webseiten abzuschätzen. Als Beispiel im Bericht dienten Fakten wie die Nationalität des US-Präsidenten Barack Obama. Das quantifizierte Ergebnis der Prüfung nennen sie "Knowledge-Based Trust" (KBT). Details zur Berechnung liefert der Bericht.
Der Vorteil dieser Herangehensweise gegenĂĽber dem Pagerank-Verfahren sei, dass nicht nur externe Signale, also die Verlinkung der Webseite, herangezogen wĂĽrden, sondern eine Bewertung der Seite selbst stattfinde. Keine Rolle habe bei den Tests gespielt, ob viele oder nur wenige Fakten aus einer Seite extrahiert worden seien; nur die VertrauenswĂĽrdigkeit der Informationen sei relevant gewesen.
Beim Vergleich der Pagerank- und KBT-Bewertungen von 2000 zufällig ausgesuchten Seiten fiel dem Bericht zufolge auf, dass vertrauenswürdige Seiten überdurchschnittlich oft, aber eben nicht immer auch gut verlinkt sind. Daraus folgert die Forschergruppe fürs Suchmaschinen-Ranking: "KBT kann Quellen mit vertrauenswürdigen Daten aufspüren, die wenig bekannt sind und einen niedrigen Pagerank aufweisen."
Umgekehrt habe man 15 Gossip-Webseiten untersucht, von denen 14 unter den Top-15-Prozent im Pagerank liegen – solche Seiten seien eben oft sehr populär. Deren KBT habe sich aber deutlich unter 50 Prozent aller getesteten Seiten befunden. Ein ähnlich umgekehrtes Verhältnis von Pagerank und KBT gelte für die Kategorie Web-Forum. (hob)