Open Source für Übersetzer

Die Übersetzerwelt ist eine Windows-Welt: MS Word und das Übersetzerwerkzeug SDL Trados sind hier das Maß der Dinge. Wer ein anderes Betriebssystem bevorzugt oder keine Lust hat, sich dem SDL-Diktat zu beugen, hat erst einmal einen schweren Stand. Doch es gibt sie, die Alternativ-Tools – auch für Mac- und Linux-User. Und ein Teil davon ist Open Source.

In Pocket speichern vorlesen Druckansicht 11 Kommentare lesen
Lesezeit: 13 Min.
Von
  • Alexandra Kleijn
  • Dr. Oliver Diedrich
Inhaltsverzeichnis

Kaum eine Berufsgruppe dürften so treue Microsoft-Kunden sein wie die Übersetzer. Nicht verwunderlich, wenn man bedenkt, dass ihre Auftraggeber Ausgangstexte in vielen Fällen immer noch im altbekannten .doc-Format liefern – in der Praxis regiert Word 2003. Der Umstieg auf Office 2007 und das noch recht neue 2010 – und damit auf XML-basierte, offenere Dateiformate – vollzieht sich nur langsam.

Mit dem quelloffenen Büropaket OpenOffice steht allerdings eine kostenlose Alternative zu MS Office zur Verfügung, die der Konkurrenz in Sachen Funktionalität kaum nachsteht. Ein großer Vorteil der Open-Source-Suite ist die Tatsache, dass sie gleichermaßen gut unter Windows, Mac OS X und Linux läuft. Als eigenständige Büro-Software ist OpenOffice für viele Anwender eine gute Wahl.

OpenOffice ist Open Source: Man erhält das Programm mit seinen Quelltexten, und jeder, der sich dazu berufen fühlt, kann die Anwendung nach eigenen Vorstellungen ändern. Open-Source-Software darf zudem in der Regel ohne Einschränkungen an andere weitergegeben werden. Auch wenn es dem Entwickler eines quelloffenen Programms frei steht, für seine Anwendung eine Lizenzgebühr zu verlangen, ist Open-Source-Software meist lizenzkostenfrei. Da Open Source in der Regel auf offene Standards setzt, ist Datenaustausch zwischen verschiedenen Programmen leicht möglich.

Auch mit dem altbekannten .DOC-Format aus Microsofts Textverarbeitung Word 2003 und früheren Versionen kommt OpenOffice Writer, das Schreibprogramm von OpenOffice, gut zurecht. Problematisch sind allerdings MS-Office-Dokumente mit Makros, vielen eingebetteten Bildern und Formularen. Auch bei aufwendigen Formatierungen, etwa einer Aufteilung des Textes in Spalten, muss man häufig von Hand nachhelfen.

Nicht so gut sieht es beim Dokumentenaustausch mit Microsofts neuem XML-basierten Format Office Open XML (OOXML) aus, dem Standard-Dateiformat von MS Office 2007 und 2010 (Dateiendung .docx). Die ursprüngliche Formatierung von Docx-Dateien bleibt beim Öffnen in OpenOffice oft auf der Strecke. Auch der Weg zurück ist (noch) versperrt: Dokumente lassen sich in OpenOffice Writer nicht als DOCX abspeichern, zumindest nicht unter Windows und auf dem Mac – die Linux-Version von OpenOffice bietet diese Möglichkeit bereits. Das schränkt den Nutzen von OpenOffice als MS-Office-Ersatz für Übersetzer ziemlich ein: Wer einen von einem Kunden erhaltenen DOCX-Text nach der Übersetzung zurückschicken will, muss das Dokument im alten DOC-Format oder im ODF-Format von OpenOffice speichern.

ODF, ein von der ISO anerkanntes Standard-Dateiformat für Textdokumente, lässt sich in Word 2007 mit Service Pack 2 sowie in Word 2010 direkt öffnen. Bei älteren MS-Office-Versionen kann man die ODF-Unterstützung mit Hilfe des Sun ODF Plugin nachrüsten. Das kostet beim neuen Eigentümer Oracle zwar Geld, kann aber im Software-Verzeichnis Softpedia noch kostenlos heruntergeladen werden. Das Plug-in kennt schon die Funktionen der neuen Spezifikation ODF 1.2; Microsoft Office 2007 und 2010 unterstützen lediglich ODF 1.1. Mac-Anwender stehen mit leeren Händen da: Microsoft Office für Mac 2008 und 2011 kennen das ODF-Format nicht.

LibreOffice speichert auch im neueren .docx-Format.

Seit Herbst 2010 buhlt der OpenOffice-Ableger LibreOffice um die Aufmerksamkeit der Anwender. Dieser sogenannte Fork entstand nach der Übernahme durch Oracle von Sun, Hauptentwickler der quelloffenen Bürosuite. Das aktuelle LibreOffice 3.3, das auf dem gleichen Quellcode wie OpenOffice 3.3 aufsetzt, kann Docx-Dateien nicht nur öffnen, sondern auch speichern. Allerdings gilt hier die gleiche Formatierungsproblematik wie bei OpenOffice.

Für Mac-Benutzer steht seit dem vergangenen Oktober Microsoft Office für Mac 2011 zur Verfügung. Die neue Version nähert sich deutlich der Windows-Ausführung an und unterstützt auch endlich wieder Visual Basic for Applications (VBA), sodass Office-Makros plattformübergreifend funktionieren sollten.

Für viele Übersetzer unverzichtbar ist ein Translation Memory System. Auf dem Markt für TM-Umgebungen tummeln sich diverse Anbieter. Platzhirsch SDL, der Hersteller des TMS Trados, hat in den vergangenen Jahren gehörig Konkurrenz bekommen. In Deutschland erfreuen sich zum Beispiel Across und MemoQ zunehmender Popularität. Alle diese Tools sind allerdings proprietäre Software. Immerhin haben plattformübergreifende TM-Werkzeuge wie Wordfast Pro und Swordfish die Microsoft-Hegemonie etwas durchbrochen. Sie sind in Java programmiert und laufen auch unter Mac OS X und Linux.

Kochten vor wenigen Jahren noch alle Hersteller ihr eigenes Süppchen – mit allen daraus entstehenden Kompatibilitätsproblemen –, geht der Trend zunehmend in Richtung offene Standards: XLIFF (XML Localization Interchange File Format) für den Dokumentenaustausch und TMX (Translation Memory Exchange) für Translation Memories. Beide basieren auf XML. Die eXtensible Markup Language trennt die Inhalte von sonstigen Informationen wie Formatierungen und Metatags vor und hat sich als Standard für den plattform- und programmübergreifenden Austausch von Daten aller Art etabliert. Optimal ist die Lage jedoch noch keineswegs: Viele Hersteller hantieren mit eigenen Auslegungen dieser Standards – und für viele ist das "unsaubere" bilinguale Word-Dokument nach wie vor Maß der Dinge.

OmegaT, ein quelloffenes Translation Memory System.

Das einzige quelloffene TM-Tool, das sich derzeit wirklich für den Produktiveinsatz eignet, ist OmegaT. Das ebenfalls in Java geschriebene Programm kann Texte in Microsofts OOXML direkt bearbeiten; mit früheren Office-Versionen erstellte Dokumente müssen zuerst entweder mit MS Office 2007/2010/2011 (Mac) oder mit OpenOffice konvertiert werden, bevor sie sich übersetzen lassen. Bei einer Konvertierung mit OpenOffice lauert die schon erwähnte Gefahr, dass aufwendig gestaltete Dokumente die Umwandlung nicht ohne Formatierungsänderungen überstehen.

Dem Beta-Stadium noch nicht entwachsen ist das Projekt openTM2 . Im Mittelpunkt steht hier die Open-Source-Implementierung eines TM-Urgesteins: des IBM TranslationManagers. openTM2 hat sich das hehre Ziel gestellt, die Referenzplattform für den Translation-Memory-Austauschstandard TMX zu werden. Die jetzt verfügbare Testversion läuft nur unter Windows.