Neue Algorithmen: Google-Turbo aus Stanford

Dank ihrer neuen Verfahren soll die Suchmaschine Google das Web bald bis zu fünfmal schneller katalogisieren können, versprechen Wissenschaftler der Stanford-Universität.

In Pocket speichern vorlesen Druckansicht 79 Kommentare lesen
Lesezeit: 2 Min.
Dank ihrer neuen Verfahren soll die Suchmaschine Google das Web bald bis zu fünfmal schneller katalogisieren können, versprechen Wissenschaftler der Stanford-Universität. Damit, so hoffen die Forscher, ließen sich mit Google bald themenspezifische Anfragen oder -- in noch fernerer Zukunft -- personalisierte Suchen durchführen. Ein solches individuelles Ranking wäre nach Ansicht von Stanford-Forscher Sepandar Kamvar unter den heutigen Voraussetzungen nicht machbar, es würde "5000 Computer fünf Tage lang beschäftigen".
Ein Verfahren namens BlockRank soll die Geschwindigkeit von PageRank verdreifachen. Der PageRank-Algorithmus ist das Herzstück von Google, seine Geschwindigket und Qualität der Grund dafür, warum deren Entwickler und Gründer mit ihrer Suchmaschine Erfolgsgeschichte schrieben. PageRank gewichtet die Relevanz einer Website danach, wie viele Links auf sie zeigen, wobei Verweise von ihrerseits stark verlinkten Sites stärker ins Gewicht fallen.
BlockRank soll helfen, den Index besser zu strukturieren: Nach Erkenntnissen der Forscher verweisen 80 Prozent der Seiten einer Homepage zu anderen Seiten derselben Homepage. Würde PageRank zunächst diese internen Verweise abarbeiten und als eine Art Einheit behandeln, bevor das gesamte Internet gescannt wird, könnte das den Algorithmus beschleunigen.
Ferner fanden die Forscher heraus, dass die Rangfolge weniger relevanter Seiten sehr früh von PageRank berechnet werden, da sie selten verlinkt werden. Dennoch werden diese bei der späteren Arbeit auf anderen Sites immer wieder aufs Neue re-analysiert. Diese redundanten Berechnungen zu eliminieren, soll weitere 50 Prozent mehr Geschwindigkeit bringen.
Noch weitere 50 Prozent wollen die Forscher mit neuen Extrapolationsmethoden aus Googles PageRank herausholen: Dabei wird einfach angenommen, dass die Linkstruktur des WWW wesentlich einfacher ist als in der Wirklichkeit. Die Ergebnisse sind nicht hundertprozentig korrekt, seien aber eine gute Näherung und könnten anschließend verfeinert werden.
Die drei Turbo-Tools für Google sind nach Ansicht ihrer Entwickler geeignet, eine themenspezifische Suche mit Google zu realisieren; für eine personalisierte Suche müsse man es dagegen schaffen, PageRank etwa zehnmal schneller zu machen. Die Forscher wollen ihre Ergebnisse auf der am 20. Mai startenden World Wide Web Conference in Budapest präsentieren; die Google-Betreiber haben die Forschungsergebnisse aus Stanford, wo auch sie selbst den PageRank-Algorithmus entwickelten, bislang noch nicht kommentiert.