"Das verändert das Spiel"

Peter Norvig, Chef der Google-Forschungsabteilung, über Spracheinegabe, künstliche Inteligenz und die Projekte, die Google in den nächsten Jahren plant.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 8 Min.
Von
  • Kate Greene
Inhaltsverzeichnis

Peter Norvig ist Googles Forschungschef – und Experte in der Entwicklung von Software, die schwere Fragen beantworten muss. Der Spezialist für Programmiersprachen und Künstliche Intelligenz hat ein prägendes Buch zum Thema KI geschrieben ("Artificial Intelligence: A Modern Approach") und an der University of California in Berkeley und der University of Southern California gelehrt. Vor seinem Job bei Google war er Leiter der Abteilung für Computerwissenschaften bei der NASA.

Seit 2001 ist Norvig bei der Suchmaschine und war zunächst als Direktor für die Suchqualität zuständig Vier Jahre später wurde er zum Forschungsdirektor ernannt. Norvig leitet nun ein Team aus rund 100 Forschern, die Themen aus vielen Bereichen beackern – von der Highspeed-Vernetzung bis hin zur maschinellen Übersetzung. Technology Review sprach mit Norvig über die Suchtechnologie der Zukunft.

Technology Review: Herr Norvig, was machen Sie bei Google Research eigentlich genau?

Peter Norvig: Unser Fokus liegt noch immer in den Bereichen Suche und Werbung. Viele unserer Forscher arbeiten daran. Sie arbeiten daran, qualitativ bessere Suchergebnisse zu liefern – und Anzeigen, die besser zu ihnen passen. Ein anderer Forschungsbereich ist die Erfassung neuer Informationsquellen wie Texten aus Büchern, Standbildern, Videos und nun auch Audio im Sinne der Spracherkennung. Wichtig ist uns außerdem, wie der Mensch mit Google und dem Web grundsätzlich interagiert. Wie verwenden Nutzer diese sozialen Netzwerke? Die Antwort auf diese Frage wird uns künftig dabei helfen, unseren Kunden besser zu dienen.

TR: Welcher Forschungsbereich beschäftigt die meisten Menschen bei Ihnen und bekommt das meiste Geld?

Norvig: Die zwei größten Projekte sind die maschinelle Übersetzung und unsere Sprachforschung. Übersetzungen und Sprache begannen mit ein, zwei Forschern und werden nun bereits in einem Live-System angeboten.

TR: Das Google Labs-Projekt "GOOG-411", bei dem man nach örtlichen Geschäfte mit dem Telefon über eine Sprachsteuerung suchen kann, lief ähnlich ab Worum geht es dabei?

Norvig: Das ist der einzige große Telefon-Suchdienst seiner Art, der ohne jegliches menschliches "Fallback" auskommt. Er ist zu 100 Prozent automatisiert und er wird bereits gut angenommen. Grundsätzlich sieht es derzeit so aus, als würden sich die Dinge in Richtung Mobilgeräte bewegen. Dabei geht es immer auch darum, wie man mit solchen Diensten auch ohne Tastatur arbeiten kann und Suchbegriffe beispielsweise per Sprache eingibt.

TR: Spracherkennung ist auch für die Video-Suche wichtig. Firmen wie Blinkx und Everyzing sind zwei Beispiele für Start-ups, die das Auffinden von Begriffen innerhalb von Videos erlauben. Arbeitet Google an ähnlichen Ideen?

Norvig: Aktuell suchen die Nutzer nur wenig nach Inhalten innerhalb von Videos. Wenn ja, dann sind es sehr spezifische Dinge wie "Coke" oder "Mentos", um zu einem entsprechenden Spaßclip auf YouTube zu gelangen. Die Leute suchen nicht nach Stellen, in denen dieser oder jener Mann über dieses oder jenes geschichtliche Thema gesprochen hat. Aber all diese Informationen sind vorhanden und mit Spracherkennung wird man auf sie bald zugreifen können.

Wir wollten eine Sprachtechnologie, die als Interface für Telefone und auch zur Indizierung von Audiotext verwendet werden kann. Nach der Betrachtung existierender Ansätze entschieden wir uns, etwas Eigenes zu entwickeln. Wir denken, dass wir mit den Daten und Rechenkapazitäten, die uns zur Verfügung stehen, das Feld nach vorne bringen können. Aktuell sind wir ganz vorne dabei mit dem, was wir selbst gebaut haben – und dank unserer IT-Ressourcen lässt sich dies noch weiter ausbauen. Je mehr Daten wir aus der Interaktion mit den Nutzern und direkt aus hochgeladenen Videos ziehen können, desto besser werden unsere Algorithmen auf Dauer sein.

TR: Obwohl hinter den Kulissen viel geforscht wird, scheint es doch oberflächlich so, als hätte sich die Suchtechnologie in den letzten zehn Jahren kaum verändert. Wie verändert sich das Google-Interface?

Norvig: Wir befinden uns in einer Situation, bei der es ein echtes Ungleichgewicht zwischen Eingabe und Ausgabe gibt. Die Nutzer geben uns drei Worte vor und wir können ihnen trotzdem viele Daten zurückgeben. Mindestens zehn Links mit Titel, Textausschnitten und anderen Informationen über eine Seite erhält man für jede Suchanfrage.

Wir können den Leuten also schon viel zeigen. Wenn der Nutzer einen großen Bildschirm hat, kann er das, was wir ihm geben, zudem sehr schnell konsumieren. Dementsprechend ist das eine sehr schnelle Interaktion mit uns – aber eben auch eine, die aus dem Gleichgewicht geraten ist.

Eines der Forschungsvorhaben, die wir prüfen, betrifft Möglichkeiten, den Nutzer stärker einzubeziehen, ihn dazu zu bringen, uns mehr über das zu sagen, was er will. Die Menschen geben beispielsweise "Karte" bei Google ein und sind dann enttäuscht, wenn nicht gleich die Karte kommt, an die sie dachten. Die Menschen sind viel eher dazu bereit, etwas zu sagen, als etwas zu tippen. Vielleicht hilft ja auch ihnen mehr Vorschläge zu unterbreiten, was sie gemeint haben könnten, aber nicht eingegeben haben.

Auch bei anderen Nutzerinteraktionen gibt es noch viel zu tun. Wenn man ein Handy zum Surfen verwendet, sieht man oft nur einen Link. das verändert das Spiel. Wir müssen dort dann noch korrekter sein, Interaktionen vereinfachen und Informationen vielleicht auch als Audiodatei präsentieren.