Microsoft übersetzt Wikipedia-Artikel

Eine Software der Redmonder soll Wikipedia-Nutzern helfen, Artikel aus der englischsprachigen Wikipedia in andere Sprachen zu übertragen.

In Pocket speichern vorlesen Druckansicht 133 Kommentare lesen
Lesezeit: 2 Min.
Von
  • Torsten Kleinz

Die indische Forschungsabteilung von Microsoft hat das Projekt WikiBhasha vorgestellt, das Wikipedia-Nutzern hilft, Artikel aus der englischen Wikipedia in andere Sprachen zu übertragen. Derzeit unterstützt die Software 31 verschiedene Sprachen, darunter auch Deutsch.

Ziel ist es, die vielen lokalen Wikipedia-Ausgaben zu unterstützen, die noch relativ wenig Inhalte zu bieten haben. So enthält die englischsprachige Wikipedia mehr als 3,4 Millionen Artikel, die Hindi-Ausgabe der freien Online-Enzyklopädie hingegen nur 57.000. Mit dem Microsoft-Tool soll das Wissen aus der englischen Ausgabe in mehr Sprachen verfügbar gemacht werden. Die Wikimedia Foundation hat sich den Ausbau der verschiedenen Sprachausgaben auf die Fahnen geschrieben. In den kommenden Monaten will die Stiftung ein Büro in Indien eröffnen.

Screenshot

Mit WikiBhasha lassen sich neue Artikel erstellen, es können auch ausgewählte Inhalte aus englischen Artikeln in andere Sprachen übertragen werden. Der Nutzer bekommt in einer zweigeteilten Ansicht die maschinelle Übersetzung und den bestehenden Artikel angezeigt. Er kann so einzelne Sätze oder Absätze in seine Landessprache kopieren und etwaige Übersetzungsfehler korrigieren.

Von diesen Nachbearbeitungen will Microsoft profitieren. "Wenn ein Nutzer einen Satz korrigiert, wird dies in der cloud-basierten Datenbank abgespeichert", erklärt Projektleiter A Kumaran, der für Microsoft im Bereich der maschinellen Übersetzung forscht. Microsoft verspricht sich aus dem Community-Projekt Daten, die bei der Verbesserung der eigenen Übersetzungsdienste helfen. Nutzer-Daten sollen jedoch keinesfalls gespeichert werden. Sowohl angemeldete als auch anonyme Wikipedia-Autoren können das Tool nutzen.

Der Dienst basiert auf Microsofts eigener Cloud-Plattform Windows Azure und wird als Bearbeitungslayer über dem normalen Wikipedia-Editor eingeblendet. Der Zugriff funktioniert plattformübergreifend per Bookmarklet. Offiziell werden Internet Explorer und Firefox sowie Windows respektive Linux unterstützt. Microsoft hat aber auch ein User-Script und eine MediaWiki-Erweiterung Apache-2-Lizenz als Open Source veröffentlicht, das den Zugriff auf das Tool direkt aus der Wikipedia ermöglicht.

Ob und wann WikiBhasha in Wikipedia offiziell eingeführt wird, steht bislang noch nicht fest. Danese Cooper, Technik-Leiterin der Wikimedia Foundation begrüßt das neue Projekt in einem Blog-Eintrag. In der Vergangenheit hatten maschinelle Übersetzungen in der Wikipedia-Community einen eher schlechten Ruf. Die von "Bots" übertragenen Inhalte waren oft von schlechter Qualität und täuschten in einigen Wikipedia-Ausgaben Aktivität vor, obwohl sich kaum Autoren um die Pflege und Korrektur der Inhalte kümmerten. (anw)