Wolframs Weißer Elefant?
Durchbruch in der KI, Angriff auf Google, 42: Die Ankündigung der Wissensmaschine Wolfram|Alpha sorgt für Wirbel - und wirft Fragen auf, die sie selbst natürlich nicht beantworten kann.
- Niels Boeing
Ja, das knallt: Mit der Ankündigung einer computational knowledge engine hat der britische Mathematiker Stephen Wolfram vergangene Woche in seinem Blog eine echte Bombe gezündet. "Wolfram|Alpha" soll in der Lage sein, beliebige Fragen nach Faktenwissen, die in natürlicher Sprache in ein schlichtes Eingabefeld auf der Webseite eingegeben werden, zu beantworten.
Nun rätselt die IT-Gemeinde, wie das gehen soll. Wolfram selbst hat nur so viel verraten:
"I’m happy to say that with a mixture of many clever algorithms and heuristics, lots of linguistic discovery and linguistic curation, and what probably amount to some serious theoretical breakthroughs, we’re actually managing to make it work."
Im Prinzip formuliert er damit den Anspruch, den alten Traum der KI vom allumfassenden Expertensystem verwirklichen zu können. Gescheitert sind daran viele. Aber Wolfram ist nicht irgendwer, als Schöpfer der Software "Mathematica" und Autor des Buches "A new kind of science" hat er sich den Ruf erworben, einer genialsten Köpfe der Gegenwart zu sein.
Sollte Wolfram|Alpha funktionieren, wird es mit Sicherheit kein Google-Killer sein, wie manche schon voreilig herausposaunen, weil es keine Suchmaschine ist. Als "Antwortmaschine" würde es eher der Wikipedia und anderen Online-Enzyklopädien Konkurrenz machen.
Die eigentlich interessante Frage ist für mich aber: Wieviel relevantes Wissen kann Wolfram|Alpha liefern?
Wie Nova Spivack, CEO von Radar Networks, auf TechCrunch schrieb, geht es um Fragen nach Fakten, also nach Orten, Jahres- oder Einwohnerzahlen oder der Anzahl der Protonen in einem bestimmten Element. Also scheinbar einfache Fragen, die klare Antworten haben.
Mit den einfachen Fragen ist das aber so eine Sache, wie ich in einem kurzen Brotjob in den Neunzigern als Fragenschreiber für ein TV-Quiz festgestellt habe. Anders als bei Jauchs Show konnte die Antwort nicht aus einer multiple choice ausgewählt werden – der Kandidat musste die Antwort selbst formulieren. Schon auf die Frage etwa "Wo liegt Lima?" gibt es mehrere Antworten: in Peru, in Südamerika, am 12. südlichen Breitengrad, auf der Erde... Oder: "Wer schrieb die Zauberflöte?" Die meisten würde antworten: Mozart. Das Libretto schrieb allerdings Emanuel Schikaneder. Da es in dem Quiz um Geld ging, musste bei solchen Unklarheiten regelmäßig der Schiedsrichter des Senders eingeschaltet werden. Für solche schlampigen Formulierungen wie etwa obige Zauberflöten-Frage hätte die Redaktion schon mal eins auf den Deckel bekommen.
Wolfram|Alpha-Nutzer müssten also im Prinzip möglichst präzise fragen - was mit Sicherheit nicht alle Nutzer tun, die ab Mai die Seite stürmen werden. Ich bin schon gespannt auf den Ärger, der da folgt, vermute aber, dass die Maschine sicherheitshalber einfach mehr Informationen ausspuckt als nur eine einzige Zahl oder einen einzigen Begriff.
Wer etwa nach den Daten wichtiger technischer Innovationen im Netz recherchiert, wird feststellen, dass es auf etliche scheinbar einfache faktische Fragen widersprüchliche Antworten gibt. Welcher war der erste moderne Computer, und wann wurde er gebaut? War es der Z1 von Zuse oder erst der Z3? Welches Kriterium legt man zugrunde - dass es eine echte Turing-Maschine sein muss?
Die Antwort hängt also auch davon ab, wie die Wissensbasis der Antwortmaschine aussieht. Dazu gibt es im Moment nur spärliche Details von Nova Spivack, der schreibt, dass die Antworten jeweils berechnet werden und sich damit vom bislang ehrgeizigsten vergleichbaren Projekt, Cyc von Douglas Lenat, unterscheiden. Cyc unterhält eine Datenbank, in dem Alltagswissen - bis heute eine harte Nuss für die KI - in Konzepten und Assertionen gespeichert ist. Auf die wird dann eine Inferenzmaschine, also ein Satz logischer Operationen, losgelassen. Damit kann Cyc etwa auf die Frage nach „allen gewählten Staatsoberhäuptern nördlich des Äquators“ eine entsprechende Liste auszuspucken.
Bei Spivack lesen wir hingegen Kryptisches (was auch daran liegt, dass er Wolfram versprochen hat, keine Details zu nennen): "Wolfram Alpha doesn’t simply contain huge amounts of manually entered pairs of questions and answers, nor does it search for answers in a database of facts. Instead, it understands and then computes answers to certain kinds of questions." Aha.
Selbst wenn es Wolframs Team gelungen ist, eine ganz neue Form der Wissensrepräsentation zu entwickeln, hängt viel davon ab, welche Fakten als Grundlage dienen. Da sie auch bei Wolfram|Alpha immer noch von Menschen ausgewählt werden, fließen hier unvermeidliche Perspektiven, Wertungen und Voreingenommenheiten ein.
Natürlich muss die Antwortmaschine bis auf weiteres auf Englisch befragt werden. Lässt sich das System theoretisch auf beliebige Sprachtypen anwenden? Funktioniert es für agglutinierende Sprachen (z.B. Türkisch), flektierende Sprachen (z.B. Deutsch) und analytische Sprachen (z.B. Chinesisch) gleichermaßen, um einmal morphologische Sprachtypen zu nehmen? Da wäre es spannend zu wissen, welche "linguistischen Entdeckungen" Wolfram und seine Leute gemacht haben.
Die Frage, die mich am meisten beschäftigt, ist jedoch eine andere: Wie wichtig ist Faktenwissen in unserer Zeit? "333 - bei Issos Keilerei", diese Eselsbrücken unserer Großeltern stammen aus einer Zeit, in der Schulbildung wesentlich mit Faktenwissen identifiziert wurde. Das half schon 1929 kaum, um die damals ausbrechende Weltwirtschaftskrise zu verstehen. Jetzt fragen wir uns wieder: Wie funktioniert der Kapitalismus? Wie kam es zur Krise? Was ist Geld? Wie reguliert man Märkte? Fragen, auf die uns Wolfram|Alpha kaum erhellende Antworten geben wird.
Ich lasse mich gerne vom Gegenteil überzeugen, aber im Moment beschleicht mich der Gedanke, dass die Antwortmaschine die Lösung eines Problems ist, das im Denken der Vergangenheit entstand. Ich bezweifle, dass sie einen neuen Weg für den Umgang mit Wissen im 21. Jahrhundert weisen wird. (wst)