Lost in (Machine) Translation?

 

Wer hätte nicht schon einmal davon geträumt, eine Sprache zu verstehen, ohne sie lernen zu müssen? Ohne sich durch endlose Vokabellisten, komplizierte Grammatikregeln mit tausend Ausnahmen zu quälen? Sogar in der Literatur begegnen wir diesem Menschheitstraum in Gestalt des Babelfischs („Per Anhalter durch die Galaxis“). Machine Translation oder maschinelle Übersetzung scheint diese Idee mittlerweile in greifbare Nähe zu rücken.

Machine Translation (MT oder dt. MÜ) findet in vielen Bereichen der Kommunikation unserer globalisierten Welt Anwendung und ist mittlerweile ein unverzichtbares Mittel, um die im internationalen Internet rasant anwachsende Menge an Textübersetzungen zu bewältigen. Jeden Tag werden riesige Mengen an Content generiert, die schnell in den verschiedensten Sprachen verfügbar sein sollen. Diesen steigenden Bedarf an Übersetzungen können menschliche Übersetzer alleine nicht abdecken. Betriebsanleitungen, Handbücher, Online-Chats und ähnliches werden oft maschinell übersetzt, wobei das Ergebnis dem Leser mitunter eher Belustigung als Erkenntnis bietet. Im Internet kursieren jede Menge dieser „Übelsetzungen“.

Aber was ist eigentlich Machine Translation? Laut Wikipedia bezeichnet MT „die automatische Übersetzung von Texten aus einer Sprache in eine andere Sprache durch ein Computerprogramm“. Erste Übersetzungsprogramme entstanden bereits in den 30-er Jahren. In den 50-er Jahren intensivierte sich die Entwicklung hauptsächlich im militärischen Bereich. Da sie mit Wort-für-Wort-Technologie arbeiteten, also keinerlei grammatikalischen Strukturen berücksichtigten, ließen die Ergebnisse natürlich noch sehr zu wünschen übrig (s. „Lübke-Englisch“: gleich geht’s los = equal goes it loose).

Daraus entwickelten sich sogenannte Volltextübersetzer, die Satz-für-Satz-Technologie einsetzten. Diese statistikbasierten Programme funktionieren, indem sie möglichst große Datenmengen in dem entsprechenden Sprachenpaar analysieren und mit Hilfe von Wahrscheinlichkeitsberechnungen daraus Wörterbücher und Algorithmen, aber keinerlei linguistischen Regeln ableiten. Die Qualität der Übersetzung hängt daher stark von der Komplexität der Satzstruktur und dem Verwandtschaftsgrad der Sprachpaare ab. Ein allseits bekanntes Beispiel für statistikbasierte Übersetzung ist der Dienst Google Translate, der mittlerweile die automatisierte Übersetzung zwischen mehr als 100 Sprachen anbietet. Die Übersetzungsqualität bleibt aber aus den oben genannten Gründen wechselhaft. Seit 2016 setzt der Dienst auch neuronale Technik ein, was die Qualität deutlich verbessert.

Diese neueste Generation von Machine Translation, Neuronal Machine Translation (NMT), die erst 2014 in Erscheinung trat, lernt das Übersetzen über gigantische neuronale Netze ähnlich einem Gehirn (Deep Learning). NMT-Systeme arbeiten mit Informationsvektoren und können so komplizierte Muster und Verbindungen innerhalb dieser Muster erkennen. Gewaltige Computer trainieren mit riesigen Datensätzen mehrsprachiger Texte. Seit etwa zwei Jahren glänzt ein neuer Stern am NMT-Himmel: DeepL. Das Kölner Unternehmen nutzt sein erstes Produkt Linguee, die weltweit größte Übersetzungs-Suchmaschine, um das Superhirn von DeepL mit einer Milliarde menschlicher Übersetzungen zu füttern. Da diese neuronale Übersetzungsmaschine im kühlen Island steht, läuft sie auch bei mehr als 5,1 PetaFLOPS (5.100.000.000.000.000 Rechenoperationen pro Sekunde!) nicht heiß. In Blindtests schnitt DeepL im Vergleich zu Google Translate, Bing Microsoft Translator u. ä. deutlich besser ab.

Klingt alles wunderbar? Ist es auch! Maschinelle Übersetzungssysteme liefern teilweise erstaunlich gute Ergebnisse. Darüber hinaus sind sie kostenlos, sofort und immer verfügbar und natürlich sehr viel schneller als ein menschlicher Übersetzer. Sie sparen also Geld und Zeit!

Aber der Teufel steckt – wie so oft – im Detail: denn unsere Sprache ist ein wunderbar wandelbares und komplexes, wenig präzises und oft uneindeutiges Gebilde, das sich nur schwerlich in Algorithmen fassen lässt, so dass digitale Systeme sich daran immer wieder die Zähne ausbeißen. Besonders bei mehrdeutigen Wörtern zeigen sich die Grenzen der künstlichen Intelligenz. Als Beispiel sei der eigentlich einfache Begriff „Anlage“ genannt: es kann sich um eine Produktionsanlage handeln, eine Investition, um Stereoequipment, eine Grünfläche oder einfach um ein Blatt Papier, das einem Schreiben beiliegt. Für jede Bedeutung gibt es in der jeweiligen Fremdsprache einen anderen Begriff und nur dieser ist korrekt. Auch Verben können sich tückisch zeigen, wie am Beispiel „umfahren“ ersichtlich wird: „Sie wird das Verkehrsschild umfahren.“ Unfall oder Ausweichmanöver?

Komplizierte Pronomenbezüge, kniffelige Schachtelsätze und ähnliche grammatikalische „Teufeleien“ bringen MT-Systeme ebenfalls oft zum Stolpern. Noch schwieriger wird es natürlich, wenn es um anspruchsvolle Fach- oder literarische Texte geht. Viele Texte erfordern kulturelle und/oder technische Kenntnisse und sprachliches Feingefühl. Hier ist das Erfahrungswissen menschlicher Übersetzer gefragt. Denn MT kann nur bedingt assoziieren, Wortspiele umsetzen, zwischen den Zeilen lesen, (sinnvolle) Lösungen für Unübersetzbares finden oder Fehler im Ausgangstext erkennen. Auch Stil- oder Terminologievorgaben sind nur schwer umsetzbar.

Womit wir uns der Frage nähern, die mir in letzter Zeit öfters begegnet, nämlich, ob wir Übersetzer demnächst überflüssig werden.

Künstliche Intelligenz, und damit auch MT, wird sich weiterentwickeln und kann in vielen Bereichen, vor allem bei stark standardisierten Texten, eine echte Hilfe darstellen, die Zeit und Kosten spart. Dennoch gibt es kaum Texte, die – aus den genannten Gründen – ganz ohne menschliche Mitarbeit auskommen. Um eine wirklich gute, korrekte und vertrauenswürdige Übersetzung zu erhalten, muss ein maschinell übersetzter Text meist von einem Übersetzer „von Hand“ im sogenannten Post-Editing überarbeitet werden. So werden Übersetzer in absehbarer Zeit sicher nicht überflüssig werden, nur ihr Arbeitsfeld wird sich gemäß den veränderten Bedingungen der Übersetzungswelt wandeln und erweitern. Das Thema lautet also nicht „maschinelle Übersetzung ODER menschliche Übersetzung“, sondern „maschinelle Übersetzung UND menschliche Übersetzung“. Denn die Textmengen, die übersetzt werden müssen, sind so groß, dass für beide genug Arbeit da ist. Auch wenn Computer schneller und billiger übersetzen, besser übersetzen Menschen (wobei „schneller und billiger“ bei Fehlern schnell auch teuer werden kann…). Dass die korrekte und stilsichere Textübersetzung noch immer einen menschlichen Übersetzer oder Korrektor erfordert – daran wird sich wohl so bald nichts ändern.