"Wir lernen vom Nutzer"

Peter Norvig, Forschungsdirektor bei Google, im Gespräch mit Technology Review.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 6 Min.
Von
  • Kate Greene

Als Forschungsdirektor von Google ist Peter Norvig ganz genau mit den Problemen vertraut, die das Erfassen der wichtigsten Informationen der Welt so mit sich bringen. Er gilt für seinen Job bei Google als hochqualifiziert – schließlich dachte er einen großen Teil seines bisherigen Lebens über Probleme der Künstlichen Intelligenz nach. Als KI-Experte hat Norvig an Universitäten gelehrt, in Forschungsabteilungen der Wirtschaft gearbeitet und für die NASA geforscht. Er ist außerdem Autor des einflussreichen Lehrbuchs "KI: Ein moderner Ansatz".

Norvig kam 2001 als "Direktor für Suchqualität" zu Google; vier Jahre später übernahm er seinen jetzigen Job. In der Position als Forschungsdirektor leitet er ein Team von 100 Computerwissenschaftlern, die an den unterschiedlichsten Projekten arbeiten – vom Informationsmanagement medizinischer Daten bis hin zur maschinellen Übersetzung. Die gigantische Anzahl von Google-Servern, die das durchsuchbare Web vorhalten, dient ihnen als riesiges Versuchslabor. Die Firma sei so strukturiert, dass Forscher nicht vom Rest des Unternehmens abgekoppelt seien, betont Norvig: "Ihre Hauptloyalität gehört immer dem Produkt, an dem sie arbeiten."

Als Norvig bei Google anfing, ging es dem Konzern aus dem kalifornischen Mountain View vor allem darum, die Seiten nach vorne zu stellen, die für einen Suchbegriff am relevantesten waren. Mit zunehmendem Wachstum des Web müssen die Nutzer nun aber Funktionen erhalten, mit denen sie die Datenmengen schnell filtern können. Norvig sprach mit Technology Review über die Zukunft der Suchmaschinen.

Technology Review: Herr Norvig, Google hat viele innovative Produkt, doch das "Look & Feel" der Websuche hat sich in den letzten zehn Jahren kaum verändert. Warum?

Peter Norvig: Wir sind da auf etwas gestoßen, das die meisten Menschen mochten. Wir waren jedoch nicht die ersten. Schauen Sie sich Excite an und die anderen frühen Suchmaschinen: Da gab es auch eine Eingabebox und man erhielt eine Liste aus zehn Treffern, neben denen ein paar Informationen stehen. Dabei ist es geblieben.

TR: Was hat sich verändert?

Norvig: Die Größenordnungen, mit denen wir umgehen. Es gibt heute vielleicht Tausend Mal mehr Informationen. Es ging früher nur um Web-Seiten, heute auch um Videos, Bilder, Blogs und diverse andere Arten von Medien und Formaten. Außerdem hat sich die Geschwindigkeit verändert. Als ich angefangen habe, wurde der Index einmal im Monat aktualisiert. Wir sahen ihn wie den Katalog einer Bibliothek, als ein Langzeit-Projekt. Heute sehen wir den Index als aktuelles Medium. Wenn eine wichtige Nachricht kommt, will man davon in Minuten im Web lesen, nicht in Tagen, Wochen oder Monaten.

TR: Sie halten Googles aktuelle Genauigkeit für ziemlich hoch. Woher wissen Sie, dass das stimmt und wie wollen Sie sie weiter verbessern?

Norvig: Wir testen die Genauigkeit auf viele verschiedene Arten. Auf der groben Ebene überwachen wir, was die Nutzer auswählen. Wenn sie auf das oberste Ergebnis klicken und dann fertig sind mit ihrer Suche, heißt das wahrscheinlich, dass sie das gefunden haben, was sie wollten. Wenn sie herunterscrollen und Seite für Seite die Liste durchgehen und die Suchanfrage anschließend nochmals verändern, wissen wir, dass das Ergebnis im Gegenzug nicht so gut war.

Eine andere Testmethode besteht darin, dass wir uns zufällig bestimmte Suchanfragen auswählen und einige externe Personen dann damit beauftragen, uns zu sagen, wie gut diese Ergebnisse sind. Wir bringen ihnen vorher bei, Spam und andere unschöne Suchergebnisse zu erkennen und nehmen dann ihre Meinung auf, gleichen sie ab. Das ist eine der besten Methoden, weil wir da die echte Einstellung von Nutzern zu hören bekommen. Das können wir uns allerdings nicht immer leisten. Wir laden deshalb außerdem Leute in unsere Labors ein oder besuchen sie manchmal auch zuhause und schauen ihnen beim Suchen über die Schulter. Das zeigt uns, wo die Nutzer konkret Schwierigkeiten haben.

TR: Firmen wie Ask und Powerset wetten darauf, dass die Zukunft bei Suchanfragen liegen wird, die in ganz normaler menschliche Sprache gestellt werden – nicht mehr nur mittels potenziell mehrdeutiger Schlüsselbegriffe. Was tut Google in diesem Bereich?

Norvig: Wir denken, dass beim Verstehen natürlicher Sprache besonders wichtig ist, dass aus Worten die Konzepte werden, nach denen der Nutzer sucht. Wir glauben aber nicht, dass es große Vorteile hat, Fragen statt Schlüsselbegriffe einzugeben. Wer "Was ist die Hauptstadt von Frankreich?" tippt, bekommt keine bessere Resultate als mittels "Hauptstadt von Frankreich". Wichtig ist aber immer, auch zu verstehen, wie Worte miteinander verbunden sind. Einige Beispiele: "New York" ist etwas anderes als "York", aber "Vegas" steht auch für "Las Vegas". "Jersey" kann wiederum manchmal für "New Jersey" stehen, manchmal auch nicht. Das ist der Aspekt beim Verständnis natürlicher Sprache, auf den wir uns konzentrieren. Das meiste, was wir machen, hat mit Worten und Wendungen zu tun, nicht mit dem gesamten Satz. Wir glauben, dass es wichtiger ist, die richtigen Ergebnisse auszugeben, nicht die Schnittstelle zu verändern.

TR: Wie stark wird die Google-Suche für den einzelnen Nutzer personalisiert werden?

Norvig: Wir arbeiten an solchen Ideen an verschiedenen Stellen. Ein gutes Beispiel ist die Personalisierung von Nachrichten, in dem wir Empfehlungen zu neuen Artikeln geben. Da lässt sich das einfacher handhaben als in der größeren Web-Datenbank, weil es eine eingeschränkte Anzahl an Storys gibt. Wir überwachen, welche Neuigkeiten sich einzelne Nutzer ansehen und vergleichen das dann mit anderen. Und das scheint ganz gut zu funktionieren. Es ist schwieriger, solche Prinzipien auf etwas derart riesiges wie das ganze Web anzuwenden. Wir beginnen mit den einfachen Sachen.

TR: Wo sehen Sie die Google-Suche in zwei bis fünf Jahren?

Norvig: Es wird eine Integration der verschiedenen Arten von Inhalten geben. Wir gehen in den Bereich Spracherkennung hinein und kümmern uns um all diese Schnittstellen auf Mobiltelefonen, die nur kleine Bildschirme und eine schwer zu bedienende Tastatur haben. Unsere verschiedenen Angebote werden außerdem kombiniert werden, Wir haben das vorher immer dem Nutzer aufgebürdet, ob er nun im Web, nach Bildern oder Videos suchen will. Nun versuchen wir, das für ihn zu lösen und die Ergebnisse zu präsentieren, die sinnvoll sind. (bsc)