Digitales Anti-Babel

Das Projekt "Meadan" versucht, Menschen aus dem Westen und den arabischen Ländern wenigstens im Internet zusammen zu bringen - unter Nutzung ausgefeilter Übersetzungstechnologie.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 4 Min.
Von
  • Shereen El Feki

Die Anschläge des 11. September 2001 hatten die unterschiedlichsten Auswirkungen auf Millionen von Menschen. Bei Ed Bice, einem ehemaligen Architekten aus den USA, weckten die schrecklichen Ereignisse den Wunsch, zwischen ganz normalen Menschen im Nahen Osten und ganz normalen Menschen in den westlichen Ländern eine neue Kommunikationsbrücke zu bauen - um Vorurteile abzubauen, sich näher zu kommen und diejenigen, die sich sonst womöglich völlig fremd wären, zu Freunden zu machen. Bice lebt selbst im Silicon Valley - da lag es nur nahe, das Internet für seine Idee zu nutzen.

Sechs Jahre später steht das Kind mit dem Namen "Meadan", was im Arabischen so viel wie "Marktplatz" bedeutet, kurz vor dem Start. Das Grundprinzip ist einfach: Die Website bringt Englisch- und Arabisch-sprachige Menschen zusammen, in dem sie tagtäglich Nachrichten, Multimedia und Internet-Events anbietet, für die sich ein möglichst breites Publikum aus beiden Regionen interessiert. Zusätzlich existiert eine Plattform zur Kommunikation - mit Dialog- und Blog-Funktion und anderen Möglichkeiten des Austauschs via Internet. Die Nutzer melden sich dabei jeweils mit ihrem Aufenthaltsort an, so dass jeder sehen kann, dass man hier über Kontinente hinweg kommuniziert.

All das wäre an sich nichts Besonderes - diverse "Social Networking"-Angebote arbeiten nach einem ähnlichen Prinzip. Die Herausforderung bei "Meadan" besteht darin, dass die Menschen ihre Gedanken in der jeweiligen Muttersprache ausdrücken können sollen - die Website soll sie automatisch in den jeweils anderen Zungenschlag übersetzen. Bice hat sich daher mit IBM zusammengetan, wo man insgesamt 1,7 Millionen Dollar in das Non-Profit-Projekt "Meadan" stecken will.

Der IT-Konzern besitzt eines der fortschrittlichsten maschinellen Übersetzungssysteme vom Arabischen ins Englische und zurück. Aktuell erreicht die Technik bis zu 84 Prozent Genauigkeit. Die Übersetzungsmaschine läuft mit 500 Worten pro Sekunde - und zwar in beide Richtungen.

Das ist alles technisch durchaus sehr komplex. "Weil die Wort-Reihenfolge im Arabischen anders ist als im Englischen, können Verben schon mal verloren gehen", erklärt Salim Roukos, Senior-Manager für Übersetzungstechnologien im IBM Watson Research Center. Arabische Worte besitzen außerdem Vorsilben, Nachsilben und andere grammatikalische Besonderheiten, die beispielsweise Numerus und Geschlecht bestimmen. Das Englische ist deutlich einfacher gestrickt - was die Übersetzung zusätzlich verkompliziert.

IBM setzt daher auf statistische Analyseverfahren, bei denen die Übersetzungsrechner zuvor mit einer gigantischen Menge an Texten in modernem Arabisch und korrektem Englisch, wie man es beispielsweise aus den Nachrichten kennt, gefüttert werden. Bis zu 100 Millionen Worte und 10 Millionen Sätze stehen dem System zur Verfügung. Dieser Datenschatz wird mit den zu übersetzenden Texten abgeglichen, um eine möglichst genaue Umsetzung zu erreichen - mit höchster Geschwindigkeit.

Verwendet der Schreiber jedoch Dialekt- oder Slangbegriffe, hat die Technik weniger gute Chancen. Das wird zusätzlich dadurch erschwert, dass das Arabische sich von Land zu Land auch noch unterscheidet.

Ob die Übersetzungstechnologie dem Projekt "Meadan" wirklich zum Erfolg verhilft, wird sich also erst dann zeigen, wenn es im Live-Betrieb arbeitet. In einem Alpha-Test, der im vergangenen Monat startete, standen der IBM-Software noch menschliche Übersetzer zur Seite, die die Texte notfalls verbesserten. Wenig zu tun hatten diese nicht.

Selbst grundlegende englische Sätze wie "Das ist toll!" funktionierten nicht immer, kamen dann beispielsweise als "Das ist groß!" im Arabischen heraus - ganz einfach weil das englische Wort "great" genauso "groß" wie "toll" heißen kann. Die Alpha-Tester mussten solche Fehler finden und die menschlichen Übersetzer dann darauf hinweisen. Die korrigierte Übersetzung wurde dann in das lernfähige System eingegeben, so dass sich solche Fehler möglichst nicht wiederholen.

Eine öffentliche Beta-Version von "Meadan" soll noch in diesem Jahr starten. Zuvor muss Ideengeber Bice allerdings noch rund 2 Millionen Dollar an Spenden auftreiben, die der Betrieb kosten wird. Er ist voller Hoffnung, die technischen Kinderkrankheiten in den Griff zu bekommen: "In einem Jahr werden wir ein globales soziales Netzwerk haben, in dem sich Menschen aus dem Westen und Menschen aus der arabischen Welt frei über globale Ereignisse unterhalten können", ist Bice überzeugt. Im Arabischen würde man womöglich noch ein "so Gott will" anhängen.

Übersetzung: Ben Schwan. (nbo)