Sprachcomputer lieben Deutsch

Nach 50 Jahren Forschung bei Spracherkennung und Sprachverarbeitung steht Deutschland dem Leiter des Intelligent User Interface Lab beim Deutschen Forschungszentrum für Künstliche Intelligenz zufolge weltweit mit an der Spitze.

In Pocket speichern vorlesen Druckansicht 214 Kommentare lesen
Lesezeit: 4 Min.
Von
  • Günter Wächter
  • dpa

Englisch gilt allenthalben als die gängige Computersprache. Wenn es aber darum geht, mit dem Rechner zu sprechen, dann ist Deutsch gefragt: "Computer lieben bei der Spracherkennung lange Worte", sagt der Leiter des Intelligent User Interface Lab beim Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI), Prof. Wolfgang Wahlster. Die für Ausländer so schwer zu lernenden Endungen und die geschlechtliche Zuordnung seien ideal. Das Englische mit seinen oft gleich lautenden aber mit verschiedenen Bedeutungen behafteten Worte seien für Rechner sehr viel schwieriger zu erkennen. Nach 50 Jahren Forschung auf dem Gebiet steht Deutschland Wahlster zufolge weltweit mit an der Spitze. Deutsche Sprachsysteme – wie sie jetzt in Bonn beim Voice Day 2006 vorgestellt wurden – sind gefragt.

Wurden sprachgesteuerte Servicedienste anfangs überwiegend abgelehnt, hat sich das mittlerweile geändert, meint Bernhard Steimel, der Sprecher der Initiative Voice Business und Organisator des Branchen- und Forschertreffs in Bonn. "Das ist eine Vernunftehe und keine Liebeshochzeit", beschreibt Steimel die steigende Akzeptanz der sprechenden Computer. Die Bereitschaft, automatisierte Dienste zu nutzen, sei in den vergangenen drei Jahren deutlich gestiegen. Das liegt nicht zuletzt an der Erfolgsquote der Systeme. "Über 80 Prozent der Anrufer, die mit dem Computer in Dialog treten, können ihr Anliegen abschließend klären", sagte Steimel. Die Systeme finden Einsatz in Call-Centern, Flughäfen, Hochschulen und Behörden.

Grundvoraussetzung für das Funktionieren ist natürlich die korrekte Erkennung des gesprochenen Wortes. "Da kann man mittlerweile Raten von über 90 Prozent korrekter Erkennung erzielen", sagt DFKI- Leiter Wahlster. "Der Mensch erkennt ja auch nicht viel mehr, wenn man es rein akustisch macht." Die Spracherkennung sei nur die primitivste Ebene – "und die beherrscht man heute gut". Es folgt die nächste Ebene wie Sprachanalyse, die das Gesagte grammatikalisch und lexikalisch verständlich macht, damit die gesprochenen Wörter auch die gewünschte Bedeutung erhalten. Schließlich gilt es, einen Dialogentwurf zu erstellen, das Dialogdesign.

"Wir haben ja heute schon Systeme, bei denen man sich als Sprecher auf den letzten Satz zurückbeziehen kann und bei denen Pronomen wie er, sie oder es berücksichtigt werden", erklärt Wahlster. Dem Ziel, den Computer als Gesprächspartner zu nutzen, sei die Forschung näher gekommen. "Wir wollen weg von Maus und Tastatur, hin zu gesprochener Sprache und Gestik." Weltweit seien die deutsche Forschung und die deutsche Technik anerkannt. Das gelte insbesondere für den Bereich Sprachverarbeitung und Sprachdialoge mit Fahrzeugen. "Wir sind mit den Spitzenfahrzeugen, was die Sprachkommunikation im Auto angeht, weltweit führend", sagt Wahlster.

Freisprechanwendungen fürs Telefon seien dabei ja schon fast ein alter Hut. Ganz neu sei etwa Musik auf Wunsch, so Wahlster. Da könne der Fahrer etwa sagen "Ich will jetzt Herbert Grönemeyer hören". Darauf werde er nach dem Songtitel gefragt. Dann werde das Lied vom MP3-Player gespielt. Im Auto könne so eine Playliste mündlich angegeben werden, die dann unterwegs über Funk eingespielt werde. Wer tanken muss und preiswerten Diesel sucht, sagt das dem Bordcomputer. Der geht ins Internet, sucht nach Angeboten und programmiert dann das Navigationsgerät mit den Daten der gewünschten Tankstelle.

Für Wahlster und seine Kollegen steht die künftige Richtung schon fest. "Die Reise geht zum multimodalen System", sagt er. Zur künstlichen Stimme soll noch das künstliche Gesicht kommen, der "virtuelle Charakter". Dieser soll auch mal bei einer entsprechenden Bemerkung die Augenbrauen hochziehen oder traurig dreinblicken – ein virtueller Gesprächspartner eben, der sich auch visuell rückkoppelt. (Günter Wächter, dpa) / (jk)