"Das wichtigste sind die ersten zehn Treffer"

Antonio Gulli, Leiter der europäischen Forschungsabteilung von ask.com über "Expert Rank", Bildersuche und das europäische Suchmaschinenprojekt Quaero.

In Pocket speichern vorlesen Druckansicht 3 Kommentare lesen
Lesezeit: 9 Min.
Inhaltsverzeichnis

Es riecht noch nach Farbe im Büro des Chefs - erst im Februar ist das europäische Forschungszentrum des Suchmaschinen-Betreibers ask.com in Pisa offiziell eröffnet worden. Das Unternehmen will in Europa kräftig expandieren: Im März hat der Suchmaschinen-Betreiber lokalisierte Beta-Versionen seines Portals in Deutschland, Spanien und den Niederlanden gestartet. Laborleiter Antonio Gulli lobt den Standort, die hervorragenden Verbindungen zur Universität - und sucht nach talentierten Nachwuchskräften. Wie viele Leute bislang in Pisa arbeiten, will er nicht verraten - zu hart ist der Konkurrenzkampf um den Nachwuchs. TR sprach mit Gulli über die technische Basis von ask.com, Bildersuche und das europäische Suchmaschinenprojekt Quaero.

TR: Warum sind Sie so zuversichtlich, als Unternehmen, das erstmal nur eine weitere Suchmaschine unter vielen anbietet, die großen Betreiber wie Google oder Yahoo angehen zu können?

Antonio Gulli: Das ist eine gute Frage. Meine Anwort ist die Folgende: Zum einen wachsen wir bereits. Wir haben eine steigende Zahl von Zugriffen. Zum anderen bin ich davon überzeugt, dass die Nutzer schließlich erkennen werden, das wir eine andere Technologie haben, als unsere Mitbewerber. Wir reden hier von einem Geschäft, das sich grundsätzlich von anderen Geschäftszweigen unterscheidet. Nehmen Sie beispielsweise Mobiltelefonie. Für den Kunden ist es wirklich schwierig, von einem Provider zu einem anderen zu wechseln. Bei Suchmaschinen ist das ganz anders. Sie probieren es aus – und wenn Sie nicht zufrieden sind, wechseln Sie. Es kostet Sie ja nichts.

Wir liefern jedoch eine neue Art von Suchresultaten. Wir zeigen nicht nur die populärsten Sites, sondern wir berücksichtigen auch die unterschiedlichen Communities, die es im Web gibt. Das ist ein sehr wichtiger Unterschied.

Das ist die Technik, die Sie Expert Rank nennen? Können Sie das etwas detaillierter erläutern?

Antonio Gulli: Sehen Sie, 1998 hatten wir diesen neuen Algorithmus im Internet: Page Rank. Der hat die Art und Weise, wie Web-Suche funktioniert, komplett verändert, weil er eine neue Idee eingebracht hat: Relevanz. Die Idee ist einfach, wenn eine Menge Leute behaupten, dass Du wichtig bist, dann bist Du wichtig. Das Problem mit diesem Algorithmus ist: Das wichtigste sind die ersten zehn Treffer. Kaum jemand schaut auf die folgenden Seiten. Die ersten zehn Resultate sind sehr, sehr wichtig. Wenn man nicht unter den ersten zehn Treffern ist, existiert man nicht.

Unser Algorithmus macht etwas anderes. Nehmen wir das Suchwort Apache. Sie haben die Community der Indianer, die der Webserver, die der Helikopter. Wenn Sie auf ask.com suchen, bekommen Sie Ergebnisse aus all diesen Communities. (Anmerkung: Das funktioniert allerdings noch nicht auf den Beta-Sites) Sie bekommen nicht nur Resultate, die sich auf den Webserver beziehen, weil der Webserver am populärsten ist. Das macht einen entscheidenden Unterschied für uns.

TR: Das heißt, Sie untersuchen auch den Content der Websites?

Antonio Gulli: Das Web ist ein große Datenquelle für Data Mining. Was wir machen ist, die Struktur zu untersuchen - die innere Struktur des Web. Da geht es nicht nur um Links. Es geht um Menschen, die miteinander interagieren. Diese Struktur werten wir aus.

Was halten Sie von der so genannten sozialen Suche, bei der die Bewertungen einer großen Menge von Usern zur Filterung von Suchergebnissen herangezogen wird? Yahoo macht das ja mittlerweile.

Antonio Gulli: Soziale Suche ist sehr interessant. Tatsächlich verwenden wir sie auch - in gewisser Weise. Ich glaube aber nicht an die Wirksamkeit der Methode, wenn der User explizit mitspielen muss – eine Bewertung angeben, oder ein Target. Wenn man sich darauf verlässt, dass die User das explizit machen, gibt es einen Haufen Schwierigkeiten. User sind bequem – und sie können Spam generieren. Wir erzielen den selben Effekt, indem wir die Stuktur des Web untersuchen. Es ist nicht notwendig, dass Sie explizit sagen: ich gehöre zu dieser oder jener Gruppe und mag dies oder jenes. Sie bauen einfach Ihre Website und dann ist es an uns, zu analysieren, was Sie mögen.

Eines der größten Probleme, das Google hat, ist die Tatsache, dass immer wieder jemand versucht, die Suchergebnisse zu manipulieren. Ist Ihr System dagegen abgesichert?