Maschinenintelligenz: Der Besserübersetzer

Bei automatischen Übersetzungen im Internet sind bislang Google und Microsoft führend. Ein Kölner Unternehmen will mit verbessertem Deep Learning nun gegenhalten.

In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen
Lesezeit: 3 Min.
Inhaltsverzeichnis

Bislang funktionieren Systeme zur maschinellen Übersetzung im Internet nicht wirklich perfekt: Sie reichen, um sich einen Überblick zu einem Thema zu verschaffen, wirklich lesbar und nach einem Menschen klingend sind die ausgespuckten Texte aber in den wenigsten Fällen.

Das Kölner Start-up DeepL, das schon seit einigen Jahren unter dem Namen Linguee eine eigene Übersetzungs-Website betrieben hat, will nun mit sogenannten Convolutional Neural Networks (Convnets) vernünftigere Ergebnisse liefern. Sie orientieren sich an Prozessen, wie sie auch im Gehirn des Menschen ablaufen. Google, Microsoft und Co. nutzen zwar ebenfalls Deep Learning, allerdings technisch anders gestaltete Ansätze.

Mehr Infos

Derzeit beherrscht der kostenlose Dienst, der unter DeepL.com ausprobiert werden kann, beliebige Sprachpaarungen zwischen Englisch, Deutsch, Französisch, Spanisch, Italienisch, Niederländisch und Polnisch. Künftig sollen auch noch Mandarin, Japanisch und Russisch hinzukommen, aktuell läuft hier die Trainingsphase.

In Blindtests will das junge Unternehmen im Vergleich zur Konkurrenz von Google Translate, Microsoft Bing Translator sowie Facebook Translate bei der Analyse durch professionelle Übersetzer qualitativ drei Mal so gut abgeschnitten haben – bei einem Probelauf mit 100 Sätzen. Auch bei den sogenannte BLEU-Scores, einem Wert, der die Qualität eines maschinell übersetzten Textes misst, will DeepL nach eigenen Angaben die Konkurrenz übertroffen haben. Und in der Tat klangen einige mit DeepL durchgeführte Probeübersetzungen oft natürlicher, wenn man sie mit Google Translate & Co. vergleicht. Dennoch darf man keine Wunder erwarten.

Der von DeepL verwendete Supercomputer erreicht eine Leistung von 5,1 Petaflops. Eine Million Worte in weniger als einer Sekunde lassen sich laut der Firma damit übersetzen. Die Hardware, die ständig ausgebaut werden soll, steht in Island, um von den dort geringen Stromkosten dank Wasserkraft und Erdwärme zu profitieren. Die Trainingsphase sei daher sehr kosteneffizient gewesen.

Man habe das System mit einer "gigantischen Sammlung" mehrsprachiger Texte gefüttert. Dabei habe das Convnet gelernt, mit zahlreichen Übersetzungen umzugehen und mit korrekter Grammatik und Satzstruktur zu agieren. Dabei half DeepL, dass sein erstes Produkt Linguee als Übersetzungssuchmaschine arbeitet, bei dem passende Übersetzungen von Textsegmenten aufgefunden werden. Mehr als eine Milliarde qualitativ hochwertig übersetzte Texte seien so zusammengekommen, "das feinstmögliche Lehrmaterial für ein neuronales Übersetzungsnetzwerk".

Das Convnet von DeepL sei nicht nur für Übersetzungen geeignet, so DeepL. Das hohe Textverständnis des Systems eröffne "mehrere spannende Möglichkeiten", so Firmengründer Gereon Frahling. Welche das genau sind, verrät die Firma noch nicht. Die semantische Texterfassung, bei denen ein Rechner den textlichen Kontext wirklich versteht, könnte aber eine sein.

(bsc)