KI
Übersetzung mit eigener Stimme
Google-Entwickler haben ein Programm entwickelt, das Universal-Übersetzern aus der Science-Fiction, wie etwa dem „Babel-Fisch“, ein Stück näher rückt: Das System gibt Übersetzungen direkt mit der Stimme des ursprünglichen Sprechers aus.
Bislang arbeiten Übersetzungsprogramme, indem sie zunächst die Audiosignale gesprochener Sprache in Text wandeln. Dann wird der Text in die Zielsprache übersetzt. Zuletzt macht eine Sprachsynthese daraus wieder gesprochene Sprache. Das von Google „Translatotron“ genannte System überspringt den Zwischenschritt und übersetzt den Inhalt, ohne ihn zwischendurch in Textform darzustellen.
Die Beispiele, die Google veröffentlicht, zeigen, dass die neue Methode noch nicht komplett ausgereift ist. Die Entwickler halten sie aber für vielversprechend. Denn durch das Auslassen des Zwischenschritts wird das System nicht nur schneller, es entfällt auch eine potenzielle Fehlerquelle. Die direkte Übersetzung hört sich zudem natürlicher an, weil sie beispielsweise Eigennamen unverändert ausgibt.
Im Translatotron wird die Eingabesprache in ein sogenanntes Spektrogramm umgewandelt, das die zeitlichen Verläufe der Frequenzverteilung des Sprachsignals darstellt. Ein spezielles neuronales Netz verknüpft das Spektrogramm in der Eingangssprache mit einem Spektrogramm der Ausgangssprache. Ein sogenannter Vocoder macht daraus dann wieder gesprochene Sprache. WOLFGANG STIELER