Watsons Methoden

IBM ist erstmals bei einer Quizshow mit einem Computer gegen Menschen angetreten. Dazu musste die Software nicht nur Faktenwissen beweisen, sondern auch subtile Andeutungen in natürlicher Sprache verstehen.

23.02.2011, 00:00 Uhr

Lesezeit: 6 Min.

MIT Technology Review

Von

Gordon Bolduan

IBM ist erstmals bei einer Quizshow mit einem Computer gegen Menschen angetreten. Dazu musste die Software nicht nur Faktenwissen beweisen, sondern auch subtile Andeutungen in natürlicher Sprache verstehen.

Wer bei der US-Quizshow „Jeopardy“ Erfolg haben möchte, braucht viel Intuition, eine gute Allgemeinbildung und ein schnelles Reaktionsvermögen. Die Kandidaten werden nicht nach einer Antwort gefragt, sondern müssen die passende Frage zu einem – oft kryptischen – Hinweis formulieren. Punkten kann nur, wer schneller ist als seine beiden Konkurrenten. Doch wer voreilig eine falsche Antwort gibt, bekommt den Geldwert der Frage abgezogen. In diesem Minenfeld voller sprachlicher Feinheiten trat IBM Mitte Februar in zwei Partien mit einem Computersystem namens „Watson“ gegen die menschlichen Kandidaten Brad Rutter und Ken Jennings an. Beide sind mehrmalige Jeopardy-Champions, Jennings konnte das Quiz in den Jahren 2004 und 2005 sogar 74-mal in Folge gewinnen. Doch überraschend schlug Watson beide. Zwar lag Rutter in der ersten Runde noch mit ihm gleichauf, die zweite Runde entschied Watson mit 77174 erspielten US-Dollar aber klar für sich. Der Triumph dieser künstlichen Intelligenz ist damit nur mit dem Erfolg des IBM-Rechners „Deep Blue“ aus dem Jahr 1997 gegen den damaligen Schach-Weltmeister Garri Kasparow zu vergleichen. Technology Review sprach mit David Ferrucci, Forscher bei IBM und Leiter des Projektes DeepQA/Watson, über Watsons Methoden und seine künftigen Einsatzmöglichkeiten.

TR: Herr Ferrucci, was hat sich IBM davon versprochen, mit einem Computersystem an einer Quizshow teilzunehmen?

Ferrucci: Wir wollten zeigen, welche Fortschritte wir bei der automatischen Beantwortung von Fragen und bei der Verarbeitung natürlicher Sprache gemacht haben.

Was sind die besonderen Schwierigkeiten bei „Jeopardy“?

Stellen Sie sich vor, ein Hinweis in der Quizshow lautet folgendermaßen: „It can be a built-in bed or a bunk on a ship, or the space for a ship to dock.“ Die dazu gehörige Frage lautet: „What is berth?“ (deutsch: „Liegeplatz“ oder „Koje“; d. Red.). Watson muss also wissen: Auf welche Personen und Objekte bezieht sich der Hinweis? In welcher Beziehung stehen sie zueinander? Und nachdem Watson den Hinweis verstanden hat, muss er schneller als die menschlichen Teilnehmer den Antwort Modus aktivieren. Dabei muss er sich bereits sicher sein, die Aufgabe lösen zu können, denn bei einer falschen Antwort gibt es Abzüge. Er muss also genug Vertrauen in sein Ergebnis haben, um sagen zu können: Ich wette darauf, dass dies die einzig korrekte Antwort ist.

Eine Software, die nicht – wie Google – viele Fundstellen anschleppt, die vielleicht passen oder auch nicht, sondern mir eine präzise Antwort auf meine Frage gibt – das klingt, als hätten Sie den heiligen Gral der künstlichen Intelligenz gefunden.

Unsere Arbeiten für „Jeopardy“ weisen in die richtige Richtung, aber angekommen sind wir noch nicht. Das liegt unter anderem daran, dass Watson bei „Jeopardy“ elektronisch in Textform kommuniziert und nicht über gesprochene Sprache. Intelligente Gespräche mit Maschinen, wie etwa bei „Star Trek“ zu hören, sind also noch Zukunftsmusik.

Beim Wettbewerb war Watson nicht an das Internet angeschlossen. Woher bekam er sein Wissen?

Das Meiste hat er sich aus Enzyklopädien, Lexika oder Romanen angelesen. Wir lassen eine ganze Menge von Programmen, die natürliche Sprache verstehen, über diese Texte laufen. Eines der Programme schaut sich zuerst die syntaktische Struktur eines Satzes an und bestimmt Subjekt, Prädikat, Objekt und Präpositionen. Ebenso wird nach Zeitangaben, Nomen und Pronomen gesucht. Anschließend werden Namen, Orte, Plätze und Ereignisse und deren Beziehungen zueinander identifiziert. Das Ergebnis wird annotiert in einer Wissensdatenbank abgelegt. Sie basiert auf der von uns zuvor entwickelten Unstructured Information Management Architecture (UIMA), stellt also keine relationale Datenbank dar.

Und wie verarbeitet Watson einen „Jeopardy“-Hinweis?

Zunächst wägen die Algorithmen ab, welche Teile eines Hinweises für die Lösung relevant sind. Auf diese Weise können wir auch mit der parallelen Struktur eines Hinweises umgehen.

Können Sie ein Beispiel dafür geben?

Ein Hinweis aus der Kategorie Kochen lautet beispielsweise: „Ich dachte, die Polizei hätte nur ein paar Fragen. Ich wusste nicht, dass ich mich wie ein Hamburger fühlen würde.“ Dieser Hinweis besteht aus zwei Teilen. Einer davon bezieht sich auf die Verhörmethoden der Polizei, der andere auf die Zubereitung eines Hamburgers. Die Lösung lautet: „Was ist gegrillt?“ Um das aber herauszufinden, müssen Sie wissen, wo der Hinweis zu teilen ist, sodass beide Aspekte gleichberechtigt in die Analyse der Frage eingehen. Das Ergebnis sind dann verschiedene Interpretationen, verschiedene Wertungen und Zerlegungen eines Hinweises, die weitere Suchen und Bearbeitungsschritte nach sich ziehen.

Arbeiten diese Algorithmen vor allem mit statistischen Methoden – also beispielsweise über die Wahrscheinlichkeit, mit der bestimmte Wörter gemeinsam auftreten? Oder spielt auch die Semantik – also die Wortbedeutung – eine Rolle?

Der Schwerpunkt liegt auf der Struktur der Sprache, auf Syntax und Statistik. Aber dabei kommt auch ein kleines bisschen Semantik zum Zuge. Wenn Watson zum Beispiel weiß, dass Cytoplasma ein Fluid ist – darf er dann auch annehmen, dass Cytoplasma eine Flüssigkeit ist? Watson stellt eine ganze Menge solcher Überlegungen an. Er geht dabei sehr akribisch vor. Genau betrachtet ist ein „Fluid“ nämlich keine Untergruppe von „Flüssigkeit“, sondern umgekehrt.

Ihr Erfolgsrezept besteht also in der richtigen Kombination von statistischer und semantischer Analyse?

Absolut. Denn wenn wir versuchen würden, Bedeutungsnetzwerke für alle in „Jeopardy“ behandelten Themen zu entwickeln, würden wir niemals fertig werden. Daher muss man das richtige Verhältnis... ()