"Das verändert das Spiel"

Peter Norvig, Chef der Google-Forschungsabteilung, über Spracheinegabe, künstliche Inteligenz und die Projekte, die Google in den nächsten Jahren plant.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 8 Min.
Von
  • Kate Greene
Inhaltsverzeichnis

Peter Norvig ist Googles Forschungschef – und Experte in der Entwicklung von Software, die schwere Fragen beantworten muss. Der Spezialist für Programmiersprachen und Künstliche Intelligenz hat ein prägendes Buch zum Thema KI geschrieben ("Artificial Intelligence: A Modern Approach") und an der University of California in Berkeley und der University of Southern California gelehrt. Vor seinem Job bei Google war er Leiter der Abteilung für Computerwissenschaften bei der NASA.

Seit 2001 ist Norvig bei der Suchmaschine und war zunächst als Direktor für die Suchqualität zuständig Vier Jahre später wurde er zum Forschungsdirektor ernannt. Norvig leitet nun ein Team aus rund 100 Forschern, die Themen aus vielen Bereichen beackern – von der Highspeed-Vernetzung bis hin zur maschinellen Übersetzung. Technology Review sprach mit Norvig über die Suchtechnologie der Zukunft.

Technology Review: Herr Norvig, was machen Sie bei Google Research eigentlich genau?

Peter Norvig: Unser Fokus liegt noch immer in den Bereichen Suche und Werbung. Viele unserer Forscher arbeiten daran. Sie arbeiten daran, qualitativ bessere Suchergebnisse zu liefern – und Anzeigen, die besser zu ihnen passen. Ein anderer Forschungsbereich ist die Erfassung neuer Informationsquellen wie Texten aus Büchern, Standbildern, Videos und nun auch Audio im Sinne der Spracherkennung. Wichtig ist uns außerdem, wie der Mensch mit Google und dem Web grundsätzlich interagiert. Wie verwenden Nutzer diese sozialen Netzwerke? Die Antwort auf diese Frage wird uns künftig dabei helfen, unseren Kunden besser zu dienen.

TR: Welcher Forschungsbereich beschäftigt die meisten Menschen bei Ihnen und bekommt das meiste Geld?

Norvig: Die zwei größten Projekte sind die maschinelle Übersetzung und unsere Sprachforschung. Übersetzungen und Sprache begannen mit ein, zwei Forschern und werden nun bereits in einem Live-System angeboten.

TR: Das Google Labs-Projekt "GOOG-411", bei dem man nach örtlichen Geschäfte mit dem Telefon über eine Sprachsteuerung suchen kann, lief ähnlich ab Worum geht es dabei?

Norvig: Das ist der einzige große Telefon-Suchdienst seiner Art, der ohne jegliches menschliches "Fallback" auskommt. Er ist zu 100 Prozent automatisiert und er wird bereits gut angenommen. Grundsätzlich sieht es derzeit so aus, als würden sich die Dinge in Richtung Mobilgeräte bewegen. Dabei geht es immer auch darum, wie man mit solchen Diensten auch ohne Tastatur arbeiten kann und Suchbegriffe beispielsweise per Sprache eingibt.

TR: Spracherkennung ist auch für die Video-Suche wichtig. Firmen wie Blinkx und Everyzing sind zwei Beispiele für Start-ups, die das Auffinden von Begriffen innerhalb von Videos erlauben. Arbeitet Google an ähnlichen Ideen?

Norvig: Aktuell suchen die Nutzer nur wenig nach Inhalten innerhalb von Videos. Wenn ja, dann sind es sehr spezifische Dinge wie "Coke" oder "Mentos", um zu einem entsprechenden Spaßclip auf YouTube zu gelangen. Die Leute suchen nicht nach Stellen, in denen dieser oder jener Mann über dieses oder jenes geschichtliche Thema gesprochen hat. Aber all diese Informationen sind vorhanden und mit Spracherkennung wird man auf sie bald zugreifen können.

Wir wollten eine Sprachtechnologie, die als Interface für Telefone und auch zur Indizierung von Audiotext verwendet werden kann. Nach der Betrachtung existierender Ansätze entschieden wir uns, etwas Eigenes zu entwickeln. Wir denken, dass wir mit den Daten und Rechenkapazitäten, die uns zur Verfügung stehen, das Feld nach vorne bringen können. Aktuell sind wir ganz vorne dabei mit dem, was wir selbst gebaut haben – und dank unserer IT-Ressourcen lässt sich dies noch weiter ausbauen. Je mehr Daten wir aus der Interaktion mit den Nutzern und direkt aus hochgeladenen Videos ziehen können, desto besser werden unsere Algorithmen auf Dauer sein.

TR: Obwohl hinter den Kulissen viel geforscht wird, scheint es doch oberflächlich so, als hätte sich die Suchtechnologie in den letzten zehn Jahren kaum verändert. Wie verändert sich das Google-Interface?

Norvig: Wir befinden uns in einer Situation, bei der es ein echtes Ungleichgewicht zwischen Eingabe und Ausgabe gibt. Die Nutzer geben uns drei Worte vor und wir können ihnen trotzdem viele Daten zurückgeben. Mindestens zehn Links mit Titel, Textausschnitten und anderen Informationen über eine Seite erhält man für jede Suchanfrage.

Wir können den Leuten also schon viel zeigen. Wenn der Nutzer einen großen Bildschirm hat, kann er das, was wir ihm geben, zudem sehr schnell konsumieren. Dementsprechend ist das eine sehr schnelle Interaktion mit uns – aber eben auch eine, die aus dem Gleichgewicht geraten ist.

Eines der Forschungsvorhaben, die wir prüfen, betrifft Möglichkeiten, den Nutzer stärker einzubeziehen, ihn dazu zu bringen, uns mehr über das zu sagen, was er will. Die Menschen geben beispielsweise "Karte" bei Google ein und sind dann enttäuscht, wenn nicht gleich die Karte kommt, an die sie dachten. Die Menschen sind viel eher dazu bereit, etwas zu sagen, als etwas zu tippen. Vielleicht hilft ja auch ihnen mehr Vorschläge zu unterbreiten, was sie gemeint haben könnten, aber nicht eingegeben haben.

Auch bei anderen Nutzerinteraktionen gibt es noch viel zu tun. Wenn man ein Handy zum Surfen verwendet, sieht man oft nur einen Link. das verändert das Spiel. Wir müssen dort dann noch korrekter sein, Interaktionen vereinfachen und Informationen vielleicht auch als Audiodatei präsentieren.

TR: Wo liegen die wichtigsten Probleme bei der Suche, die noch ungelöst sind?

Norvig: Grundsätzlich sehen wir hier zwei Aspekte. Der eine ist ein erweitertes Verständnis dafür, was der Nutzer braucht. Der andere ist das Verständnis für den Inhalt von Dokumenten, egal ob es Webseiten oder beispielsweise Videos sind. Meistens schauen wir uns an, was der Nutzer eingibt, behandeln diesen Input als einzelne Worte, zählen sie auf den Seiten zusammen und wägen diese dann gegen bestimmte andere Sachverhalte ab. Aber wir schauen nicht nur auf die eingetippten Worte. Auch Schreibvarianten und die Länge der Suchanfrage werden überprüft, dann erst wird sie in Teile zerlegt. Vielleicht meinte der Nutzer einige der Worte ja als Suchbegriff, andere wieder nicht.

TR: Hier gibt es Überschneidungen zur "Natural Language Search", bei der man eine Frage in natürlicher Sprache eingibt, statt einzelner Schlüsselbegriffe. Wie kommt Google hier voran?

Norvig: Unter dem Begriff kann man viel verstehen. Ein Teil davon wird von uns schon lange bearbeitet. Wir verstehen beispielsweise Synonyme und wissen, dass die beiden Worte "San Francisco" zusammen gehören. Aber es gibt eben auch ein "Las Vegas" und ein "Vegas" – und das meint das gleiche. "New York" und "York" hingegen nicht. Diese Dinge versuchen wir zu bewältigen. Eine andere Komponente ist das Umwandeln längerer Suchbegriff in Komponenten. Am weitesten von einer Lösung entfernt sind wir aber bei der Eingabe von vollständigen Sätzen in englischer Sprache, die dann auch eine echte Antwort in natürlicher Sprache ergibt. Darum kümmern wir uns noch wenig. Wir beantworten allerdings einige Fragen durchaus schon jetzt. Sie können "Bevölkerung Japans" eintippen und bekommen dann die Zahl geliefert.

Interessant ist auch, dass bei der Hauptzahl der Suchanfragen gar keine Fragen in natürlicher Sprache gestellt werden. Die Nutzer bemühen sich ungern, vollständige Sätze zu formulieren.

TR: Ihre Erfahrung liegt in der Künstlichen Intelligenz. Ist Google nicht im Kern eine KI-Firma, die maschinelles Lernen verwendet, um das Web zu durchsuchen, Sprache zu erkennen und Werbung mit Suchbegriffen abzugleichen?

Norvig: Die Künstliche Intelligenz versucht zumeist, Aufgaben besser zu bewältigen, für die es keine definitive Lösung gibt. Was sind die besten Resultate für einen bestimmten Suchbegriff? Es gibt darauf keine absolut korrekte Antwort, das ist subjektiv – und diese Frage beantwortet Google.

Man kann also durchaus sagen, dass das ein KI-Problem ist. Wir versuchen, das Thema mit vielen verschiedenen Ansätzen anzugehen. Das sind gute KI-Algorithmen, verbesserte Software, schnelle Hardware und ein Netzwerk, dass das alles direkt und effizient ausliefert. KI steckt also nicht überall bei Google drin, aber sie ist ein wichtiger Teil. (bsc)