"Die Maschine soll auch Fragen stellen"

Der IBM-Wissenschaftler David Gondek arbeitet im Watson-Projekt von IBM mit. Der Informatiker ist vor allem auf Maschinenlernen und Sprachverarbeitung spezialisiert. TR sprach mit Gondek am Rande der CeBIT über neue Einsatzmöglichkeiten für Watson und die Perspektiven des maschinellen Lernens.

04.03.2011, 14:02 Uhr

Lesezeit: 6 Min.

MIT Technology Review

Von

Dr. Wolfgang Stieler

Wer bei der US-Quizshow „Jeopardy“ Erfolg haben möchte, braucht viel Intuition, eine gute Allgemeinbildung und ein schnelles Reaktionsvermögen. Die Kandidaten werden nicht nach einer Antwort gefragt, sondern müssen die passende Frage zu einem – oft kryptischen – Hinweis formulieren. Punkten kann nur, wer schneller ist als seine beiden Konkurrenten. Mitte Februar trat IBM in zwei Partien mit einem Computersystem namens „Watson“ gegen die menschlichen Kandidaten Brad Rutter und Ken Jennings an. Beide sind mehrmalige Jeopardy-Champions – doch Watson schlug beide.

Der IBM-Wissenschaftler David Gondek hat von Anfang an im Watson-Projekt mitgearbeitet. Der Informatiker ist vor allem auf Maschinenlernen und Sprachverarbeitung spezialisiert. TR sprach mit Gondek am Rande der CeBIT über neue Einsatzmöglichkeiten für Watson und die Perspektiven des maschinellen Lernens. In der aktuellen Print-Ausgabe TR 3/2011 lesen Sie zudem ein ausführliches Interview mit Projektleiter David Ferrucci über die Methoden, mit denen die IBM-Forscher diesen historischen Sieg erringen konnten.

TR: Maschinenlernen scheint, wenn man den Medien glaubt, eine Art moderne Zauberei zu sein. Was kann man damit heutzutage machen und was nicht?

Gondek: Ich habe mich hauptsächlich auf Maschinenlernen im Zusammenhang mit Sprache konzentriert. Dem Verstehen von natürlicher Sprache. Was wir im Zusammenhang mit dem Watson-Projekt gesehen haben ist, dass wir durchaus in der Lage sind, ein gewisses Verständnis der menschlichen Sprache zu erreichen. Wir können Verben identifizieren. Wir können die einzelnen Teile von zusammenhängenden Sätzen auseinander halten. Wir können Zusammenhänge zwischen Wörtern erkennen: Wenn ich sage, dieser oder jener ist der Autor von diesem oder jenem, dann vermutet das System, dass ich über ein Buch spreche.

Was wir nicht gut können, ist ein tieferes Verständnis für den Kontext zu erzeugen. Während des Spiels hat Watson einmal „Toronto“ statt „Chicago“ als Antwort gewählt. Für einen Menschen ist es komplett offensichtlich, dass es sich hier um zwei völlig verschiedene Städte handelt. Für Watson ist es das nicht.

TR: Aber ich habe Sie da richtig verstanden: Das System kann automatisch Dokumente analysieren und liefert Ihnen dann die semantischen Beziehungen zwischen den einzelnen Begriffen?

Ja. Es gibt dabei allerdings immer noch Fehler. Deshalb sind noch immer Menschen an diesem Prozess beteiligt. Aber ich denke, die Technologie macht gute Fortschritte.

TR: Das würde bedeuten, Sie könnten die alte Vision vom Semantic Web einen großen Schritt vorwärts bringen?

Ja, das wollen wir. Im Zusammenhang mit dem Semantic Web zirkulieren viele Ideen. Einige meinen, dass man diese Semantik von Hand in die Internet-Dokumente einfügen müsste, die man veröffentlichen will. Ich denke, dass das vollkommen unmöglich ist. Stattdessen wollen wir automatische Technologien, die Texte analysieren können – die Objekte und Subjekte im Text identifizieren, Personen, Orte und das generelle Thema dieses Textes erkennen und so weiter.

TR: Wie gut können Sie das mittlerweile? Und wo liegen die Grenzen?

Mit dem Quellcode, den wir veröffentlicht haben, können wir 70 Prozent der Fragen richtig raten. In manchen Fällen sogar bis zu 90 Prozent. In den verbliebenen zehn Prozent haben wir meistens den Hinweis nicht richtig verstanden. Im Wesentlichen geht es also um ein besseres Verständnis natürlicher Sprache.

TR: Wie kann man das erreichen?

Wir arbeiten mit einer Menge Wissenschaftler an dem Problem. Und wir sind an einem Punkt, wo wir sagen können, dass es nichts bringt, noch mehr Prozessorleistung auf das Problem loszulassen oder noch mehr Daten zu analysieren. Wir arbeiten stattdessen an verbesserten Methoden für die Text-Analyse und an Techniken, um mit mehrdeutigen Wörtern oder Sätzen umzugehen.

TR: Können Sie mir ein Beispiel geben?

Kürzlich ging es darum, die Bedeutung des Wortes „Herstellen“ zu erfassen. Wir hatten einen Hinweis, in dem es darum ging, dass das Unternehmen Coca Cola ein neues Getränk „vorgestellt“ hat. Wenn ich Ihnen so etwas sage, gehen Sie in der Regel davon aus, dass Coca Cola dieses Getränk auch herstellen wird. Der Computer weiß das nicht. Denn er hat gelernt, dass Menschen einander „vorstellen“. Und wenn ich Ihnen meinen Onkel vorstelle, bedeutet das nicht, dass ich meinen Onkel auch hergestellt habe.

Das bedeutet, der Kontext ist sehr wichtig. Wenn ich weiß, dass von einem Unternehmen die Rede ist, weiß ich auch, dass „vorstellen“ in der Regel auch „herstellen“ bedeutet. Wir versuchen, dem System diese Fähigkeit beizubringen, damit es unterscheiden kann, in welchem Kontext welcher Satz was bedeutet.

TR: Und wie geht das?

Eine Möglichkeit besteht darin, gezielt nach solchen Mehrdeutigkeiten zu suchen. Wir suchen also nach allen Sätzen, in denen es um „vorstellen“ geht. Dann gleichen wir das mit dem Wissen ab, das wir über Firmen haben. Dabei lernt das System: Wenn es um Unternehmen geht, bedeutet „vorstellen“ dies, und wenn es um Menschen geht, etwas anderes. Wir suchen also nach Korrelationen.

TR: Statistische Korrelationen?

Ja. Aber wir untersuchen auch „Frames“. Wir untersuchen beispielsweise die Gemeinsamkeiten von Büchern. Dabei lernt das System, dass Bücher Titel haben, Hauptpersonen und so weiter. Und das System lernt die Zusammenhänge dieser Begriffe. Wenn Sie mir dann den Namen eines Romanhelden geben, weiß es, in welchem Roman der vorkommt, wer der Autor ist und wann das Buch herausgekommen ist.

TR: Wie geht es mit Ihrer Forschung weiter? Wo stehen Sie in fünf Jahren?

Unser Ziel ist ein umgangssprachlicher Dialog zwischen Mensch und Maschine. Das heißt nicht, dass sich die Maschine wie ein Mensch anhören muss. Aber wir wollen so weit kommen, dass beispielsweise ein Arzt mit der Maschine sprechen kann, dass er Fragen stellt und die Maschine den Überblick nicht nur eine Frage beantwortet sondern im Blick behält, was vorher bereits alles diskutiert worden ist. Das System weiß, was Sie bereits in der Vergangenheit gefragt haben, wo Sie mit Ihren Vermutungen und Diagnosen richtig lagen und wo nicht. Und wir denken auch darüber nach, das Wissen des am Dialog beteiligten Menschen besser auszunutzen – das heißt, die Maschine soll nicht nur Fragen beantworten sondern auch Fragen stellen. (wst)