Das Europa der 23 Sprachen - Computer sollen häufiger übersetzen

EU-Projekt "EuroMatrix" will aus der Kombination der besten automatischen Übersetzungsprogramme ein besseres machen. Derzeit fallen nur in der EU-Kommission jährlich rund 302 Millionen Euro Übersetzungskosten an.

In Pocket speichern vorlesen Druckansicht 406 Kommentare lesen
Lesezeit: 3 Min.
Von
  • dpa

Wer einmal eine Übersetzungsmaschine im Internet ausprobiert hat, kennt das Problem: Man gibt einen Satz ein, lässt ihn in eine Fremdsprache übersetzen und wieder zurück – heraus kommt selten der Ausgangssatz. Computer sind im Vergleich zum Menschen die schnelleren, aber meist die schlechteren Übersetzer. Aus Sicht von Fachleuten sind sie aber unerlässlich, um den wachsenden Wust von notwendigen Übersetzungen innerhalb der Europäischen Union zu bewältigen. Dafür müssen sie jedoch deutlich besser werden. Das ist das Ziel des europäischen Projekts EuroMatrix, das Professor Hans Uszkoreit von der Universität des Saarlandes leitet.

"Der Übersetzungsdienst der EU schafft, wenn es hoch kommt, noch zwei Drittel des anfallenden Materials zu übersetzen", schildert der 57 Jahre alte Computerlinguist das Problem. Zum einen ist die Zahl der Sprachen im Laufe der EU-Erweiterung gewachsen. Heute sind es 23 Amtssprachen. Wollte man einen Text aus jeder dieser Sprachen in jede andere Übersetzen, wären rund 500 Übersetzungen nötig. "Der Bedarf wächst außerdem ständig", sagt Uszkoreit. Nicht nur Dokumente und Rechtstexte müssen übersetzt werden, sondern auch Beipackzettel für Medikamente, Anleitungen. "Die Nachfrage aus der Industrie ist groß."

Uszkoreit betont, bei der Verbesserung der automatischen Übersetzungen gehe es darum, Millionen Euro zu sparen. Für dieses Jahr sind nach Angaben der Generaldirektion Übersetzung der Europäischen Kommission allein für die Übersetzung in der Kommission Kosten in Höhe von rund 302 Millionen Euro veranschlagt. Das entspricht etwa 63 Cent pro EU-Einwohner und Jahr. Die Übersetzungskosten in allen EU-Organen zusammengenommen beliefen sich 2006 auf schätzungsweise 800 Millionen Euro.

Ende vergangenen Jahres hat die internationale Forschergruppe um Professor Uszkoreit begonnen, eine Übersicht über die vorhandenen Übersetzungssysteme zwischen den einzelnen Sprachen zu erstellen. Ziel ist es, aus der Kombination der besten bestehenden Programme ein besseres zu machen. Zwischen wenigen Sprachpaaren, wie etwa dem Deutschen, Französischen und Englischen gebe es gut funktionierende. "Das Problem sind Sprachkombinationen wie Lettisch-Maltesisch", sagt Uszkoreit. Dort gebe es meist weder Programme noch ausreichend menschliche Übersetzer.

Derzeit gebe es grundsätzlich zwei automatische Übersetzungsmethoden: Bei der einen werden die Programme mit sehr vielen Texten gefüttert und lernen aus ihnen, dass Wörter in einer bestimmten Umgebung eine bestimmte Bedeutung haben. Das Wort Leitung muss beispielsweise anders übersetzt werden, wenn es heißt "Die Leitung ist leck" als in dem Satz "Die Leitung des Unternehmens wurde abgesetzt". Die zweite Übersetzungsmethode basiert auf den Regeln der Sprache. Die Texte werden etwa nach Grammatikregeln analysiert und anschließend übersetzt.

Um die besten Systeme herauszufinden, wollen die Forscher zu Wettbewerben einladen. "Für bestimmte Sprachenpaare werden verschiedene Programme gegeneinander antreten. Ein Übersetzer wird anschließend die Texte beurteilen", erläutert Uszkoreit. An dem EuroMatrix-Projekt, das auf 30 Monate angelegt ist und das von der EU mit 2,5 Millionen Euro gefördert wird, sind Fachleute aus Prag, Edinburgh und Italien beteiligt.

"Der Durchbruch bei der automatischen Übersetzung steht noch bevor", sagt Uszkoreit. "Unser Ziel ist es, dass ein Computer 60 Prozent richtig übersetzt und bei 40 Prozent sagt, er ist sich nicht sicher. Das geht heute noch nicht." Menschliche Hilfe und Kontrolle würden nie verzichtbar. Wie langwierig die Entwicklung der maschinellen Übersetzer ist, zeigt, dass Uszkoreit bereits in den 70er Jahren an einem der heute besten Übersetzungsprogramme mitgearbeitet hat. dpa / (uk)