Software-Genie verspricht keinen Google-Killer

Viel Vorschusslorbeeren für eine Datenbank mit Parser

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

"Stephen Wolfram is building something new […]. It’s not a "Google killer" – it does something different. It’s an "answer engine" rather than a search engine". Vermutlich wären viele herkömmliche Textparser bereits heute besser in der Lage, diese in einfachem Englisch gehaltenen Sätze zu parsen als manche Journalisten. Zumindest möchte man das glauben, wenn man sich einige der Schlagzeilen ansieht, mit denen das noch nicht fertiggestellte Projekt in den letzten Tagen vermeintlich beschrieben wurde.

Von WolframAlpha gibt es zwar bislang nur eine Dummy-Website, aber es sind schon genügend Informationen in Form zweier Blogeinträgen von Stephen Wolfram und Nova Spivack vorhanden, dass man sich ungefähr vorstellen kann, um was es geht.

Eines vorab: WolframAlpha ist kein Suchmaschine, um das WorldWideWeb zu durchzusuchen. Ergo stellt es keine Konkurrenz zu Google dar. Vielmehr handelt es sich um eine Sammlung von Informationen, auf die per Suche zugegriffen werden kann. Damit steht WolframAlpha, wenn man denn unbedingt einen Vergleich bemühen will, sehr viel eher in Konkurrenz zur Wikipedia.

Zu dieser gibt es indes zwei fundamentale Unterschiede:

  • Unterschied Nummer 1 ist, dass die zugrunde liegenden Informationen vom Betreiber ausgewählt wurden ("Wolfram's team manually entered, and in some cases automatically pulled in, masses of raw factual data about various fields of knowledge, plus models and algorithms for doing computations with the data."). Das mag möglicherweise den Vorteil bieten, dass WolframAlpha keinen offensichtlichen Unfug als Antwort anzeigt (wie das bei einem unter- oder überbetreuten Wikipedia-Artikel der Fall ist). Andererseits hat sich erwiesen, dass die Wikipedia-Selbstkontrolle bei politisch nicht kontroversen Themen hervorragend funktioniert und viele kleine Fehler entfernt, die sich durch zahlreiche Auflage von Druck-Enzyklopädien gehalten haben.
  • Der zweite Unterschied ist, dass der Benutzer Fragen in natürlicher Sprache (genaugenommen: natürlicher, englischer Sprache) stellen kann, die geparst und beantwortet werden. Die von Spivack gegebenen Beispiele zeigen, für welche Art von Fragestellungen WolframAlpha geeignet ist:

"What is the location of Timbuktu?"

"How many protons are in a hydrogen atom?"

"What was the average rainfall in Boston last year?"

"What is the 307th digit of Pi?,"

"Where is the ISS?"

"When was GOOG worth more than $300?"

Die Links weisen auf die Antworten, die jeweils per Google bestimmt wurden; die Fragen mussten ein bisschen umformuliert werden, weil die Originaltexte nur noch auf WolframAlpha-Artikel verweisen. Nach der Umformulierung war die Antwort jeweils unter den ersten drei (!) der angezeigten Websites.

Viele andere Fragen wird WolframAlpha nie lösen können, weil dafür benutzergenerierter Content notwendig wäre ("Lesbares Buch in Deutsch oder Englisch über die Geschichte des Dreißigjährigen Krieges", "Bestes Hotel in Athen, das ich bezahlen kann"). Umgekehrt behauptet Spivack, dass WolframAlpha Google überlegen sei, weil WolframAlpha Antworten errechnet; wenn sich die Antwort nicht auf einer Website findet, dann ist Google machtlos.

Das mag sein. Aber wenn interessiert denn wirklich die Antwort auf Fragen, die sich nirgends finden und die sich errechnen lassen (z.B. "What is the sum of the 307th digit of Pi and the number of protons in a hydrogen atom?")? Das mag höchstens bei komplizierten Berechnungen der Fall sein, die man ungern per Bleistift am Schreibtisch erledigt – aber dafür gibt es ja zum Glück bereits Wolframs Mathematica.

Ein Urteil über WolframAlpha verbietet sich, solange die Engine nicht läuft und man sie nicht testen kann. Aber es wird genauso wenig ein Google-Killer wie ein Wikipedia-Killer werden (außer, es könnte Fragen à la "Dear WolframAlpha, would you mind summing up for me the outline of Finnish post-WWII history" beantworten). Vermutlich wird am Ende ein bequemes Fontend haben, um numerische Informationen wie die aus den Beispielen abzufragen. Bleibt nur zu hoffen, dass es – wie einst bei Infocom-Textadventures – reicht, "OPEN DOOR" einzugeben, und man nicht "Walk over to the door, and open it" eintippen muss, um den Parser zu befriedigen.