Steinzeitlich und lieblos
Software und Gadgets werden immer schlauer, nur die maschinellen Übersetzungstools sind so blöd wie eh und je. Warum nur?
Software und Gadgets werden immer schlauer, nur die maschinellen Übersetzungstools sind so blöd wie eh und je. Warum nur?
Alles wird immer smarter, musste ich mir letzte Woche auf einem Cebit-Vortrag erklären lassen – aus dem Handy wird das Smartphone, aus dem Fernseher das Smart-TV, aus der Armbanduhr die Smartwatch. Warum nur ist die maschinelle Übersetzung dann immer noch so blöd wie vor 15 Jahren? Moore’s Law und sämtliche Fortschritte der Sprachtechnologie scheinen an den automatischen Übersetzungstools spurlos vorübergegangen zu sein. Watson hat bei Jeopardy die menschlichen Konkurrenten in Grund und Boden gespielt, Apple die leidlich verständnisvolle Assistentin Siri aufs iPhone gebracht – nur die maschinellen Dolmetscher verstehen wie eh und je nur Bahnhof.
Kürzlich habe ich einen chinesischen Text, in dem ein gewisser „Dr. Charles Gay“ vorkam, durch den Google-Übersetzer gescheucht. Google machte aus Herrn Gay unverdrossen einen „Dr. Charles Homosexuell“. Kann man lustig finden, muss man aber nicht. Das Beispiel zeigt doch, wie steinzeitlich und lieblos die Übersetzungsalgorithmen immer noch sind. Ich meine, wie schwer kann es sein, Eigennamen als solche zu erkennen? Schon vor sechs Jahren haben japanische Forscher eine Software entwickelt, die sogar Namensvettern auseinanderhalten kann.
Aber ich willl hier gar nicht mit so strapazierten Begriffen wie „Künstliche Intelligenz“, „parsen“ oder gar „semantisches Sprachverstehen“ daherkommen. Ein paar schlichte Regeln würden doch schon genügen: Wo ein Dr. oder ein Mr. steht, folgt in der Regel entweder ein Vor- oder ein Nachname. Ob es sich um einen Vornamen handelt, lässt sich leicht durch einen Abgleich mit einer Datenbank von wenigen tausend Einträgen feststellen – das dürfte für Google jedenfalls kein Hexenwerk sein. Hat man eine Kette von <Titel/Anrede> - <Vorname> - <unbekanntes Element> gefunden, ist letzteres mit großer Wahrscheinlichkeit ein Nachname, der nicht übersetzt gehört. Zur Sicherheit kann der Algorithmus ja auch noch eine Google-Suche starten, ob ein Mensch dieses Namens tatsächlich existiert. Wieviele Zeilen Code würde das Ganze erfordern? 20? 50? Wie viele Nachmittage müsste ein begabter Programmierer daran arbeiten? Zwei? Drei?
Natürlich kann so eine Simpel-Regel auch daneben liegen, wenn zum Beispiel der Nachname einem gängigen Vornamen entspricht, etwa bei einem Horst Frank. Dann hat man eben Pech gehabt, so ist das nun mal mit Wahrscheinlichkeiten. Aber immer noch besser als diese unendlich tumbe Wort-für-Wort-Übersetzung.
Es mag ja sein, dass Sprache so subtil ist, dass Software nie an die Leistung guter menschlicher Übersetzer heranreichen wird. (Vor ein paar Jahren hätte ich selbst übrigens auch noch vehement bestritten, dass ein Computer jemals bei Jeopardy gewinnt.) Aber das, was wir im Jahr 2013 an maschineller Übersetzung vorgesetzt bekommen, ist nach jeglichem Maßstab unwürdig. Klar ist Google Translate ein kostenloser Dienst, dem man nicht allzu genau ins Maul schauen sollte. Doch immerhin hat Google auch andere kostenlose Produkte wie „Google Earth“ zu beeindruckender Perfektion gebracht. Wann endlich erlöst uns jemand von diesem Übersetzungsdesaster – schon aus Gründen der technischen Selbstachtung?
(grh)