KI-Übersetzer im Vergleich

DeepL macht menschlichen Übersetzern Konkurrenz

Der große Vergleichstest: Bing, Google und DeepL treten gegeneinander an, das Kölner Startup gewinnt souverän.

Audiokabel-Steckbrücke für Übersetzungen

Automatische Übersetzungen werde immer besser

Übersetzen und Dolmetschen gehören zu den Aufgaben, bei denen erfahrene menschliche Übersetzer und Dolmetscher noch die Nase vorn haben. Doch die künstliche Intelligenz ist dabei, zur menschlichen aufzuschließen. Die drei hier verglichenen KI-Übersetzer von Microsoft, Google und dem Kölner Startup DeepL bieten bereits ganz ordentliche Übersetzungen. Der große Vorteil der Software: Sie kann bei den unterstützten Sprachen im Regelfall in alle Richtungen übersetzen. Es sind also alle Kombinationen möglich, beispielsweise Slowenisch in Slowakisch oder Urdu in Samoanisch.

Kurzvorstellung der Übersetzer

Bing Translator von Microsoft ist ein webbasierter Übersetzungsdienst, der mehr als 60 Sprachen übersetzen kann und in zahlreiche Microsoft-Produkte integriert ist. Er ist auch als App für iOS, Android und Windows erhältlich. Dabei können viele Sprachen heruntergeladen werden, sodass eine Übersetzung auch ohne Internetverbindung möglich ist. Die App übersetzt aber nicht nur eingetippte Texte, sondern auch mit der Kamera erfasste Schriftzeichen. Darüber hinaus arbeitet die App auch als Dolmetscher und kann gesprochene Sprache übersetzen.

Google Translator verarbeitet im Moment etwas mehr als 100 Sprachen. Der Übersetzungsdienst ist im Web, aber auch als App für Android und iOS verfügbar. Die Android-App arbeitet als Taschenübersetzer und -dolmetscher und unterstützt das Übersetzen von Texten, die mit der Kamera erfasst werden. Bei diesen Funktionen wird allerdings nur gut ein Drittel der Sprachen unterstützt. Noch relativ neu in der Android-App ist eine Funktion, die den Übersetzer in allen anderen Apps verfügbar macht.

DeepL ist ein rein webbasiert, kostenloser Online-Übersetzer, der im Moment nur die europäischen Sprachen Deutsch, Englisch, Französisch, Spanisch, Italienisch, Niederländisch und Polnisch beherrscht. Er ist ein Schwesterdienst der Übersetzungssuchmaschine Linguee und greift zur Qualitätsverbesserung darauf zu. Das Unternehmen bietet seit kurzem für einen Basispreis von 20 Euro den professionellen Übersetzerservice DeepL Pro. Er hat keine Längenbegrenzung der Übersetzung auf 5.000 Zeichen und bietet die Integration in marktgängige Übersetzungswerkzeuge wie Trados.

Die Aufgaben für die Übersetzer

Alle drei Übersetzer arbeiten mit KI-Verfahren, die auf Deep Learning basieren. Dabei hängt die Qualität der Übersetzung unter anderem von der Größe des Datasets für das Training ab. Es ist also wahrscheinlich, dass die Übersetzungen zwischen gängigen Sprachen besser sind als die zwischen Exoten. Für eine objektive Bewertung sollten Texte aus großen Sprachgemeinschaften genutzt werden.

Da Kenntnisse in Mandarin oder Kantonesisch in Deutschland eher selten sind, bietet sich die Übersetzung von englischen Texten ins Deutsche als Grundlage für eine Bewertung an. Als Testaufgabe sollten die Übersetzer jeweils drei Texte aus dem Internet übersetzen, die einen gewissen Schwierigkeitsgrad haben. Wegen der unterschiedlichen Längenbegrenzungen pro Übersetzungsvorgang werden von diesen Texten aber nur die ersten 3000 Zeichen genutzt.

Die erste Aufgabe ist der Artikel China’s Space Station May Crash to Earth on April Fools’ Day aus der New York Times. Er hat zwar ein technisches Thema, schildert es aber locker formuliert und nicht zu kompliziert. Die zweite Aufgabe dagegen ist schon etwas schwieriger. Nvidia looks in the AI future ist eine typische Techcrunch-Meldung mit vielen Abkürzungen und Fachbegriffen. Die dritte und schwierigste Aufgabe ist der Aufsatz A Hierarchy of Search aus dem Techie-Magazin Hacker Noon, der sich eher an Entwickler richtet

Die Ergebnisse des Tests

Insgesamt bringen alle drei Übersetzer deutsche Textes zustande, die das Verständnis der englischen Originale deutlich erleichtern. Das ist auf jeden Fall schon mal ein enormer Fortschritt gegenüber den Online-Übersetzern vor einigen Jahren. Der Einsatz von KI-Methoden hat die Qualität der Übersetzungen deutlich verbessert. Bing liefert die relativ schlechtesten und DeepL die besten Übersetzungen, Google liegt in der Mitte.

Der Kölner Online-Übersetzer schafft es im Großen und Ganzen, die drei Texte in lesbare Texte zu ersetzen, bei denen man nur selten über kuriose Übersetzungen oder fehlerhafte Syntax stolpert. Natürlich macht auch DeepL noch kleinere Fehler, doch er kommt mit elliptischen Formulierungen und mündlichem Stil deutlich besser klar als die Konkurrenten. Ein Beispiel:

Original: “We’ve been pioneering this computing approach called GPU computing for over the last decade,” Jensen said. “Over the last seven or eight years, it really went into turbo charge because the model is perfect for artificial intelligence.”

Bing: „Wir haben Pionierarbeit dieser Computing-Ansatz namens GPU Computing für die in den letzten zehn Jahren“, sagte Jensen. „in den letzten sieben oder acht Jahren, es ging wirklich in Turbo Charge, weil das Modell ist perfekt für künstliche Intelligenz.“

Google: „Wir haben in den letzten zehn Jahren diesen Computing-Ansatz mit dem Namen GPU-Computing vorangebracht“, sagte Jensen. „In den letzten sieben oder acht Jahren ist es wirklich Turbo geworden, weil das Modell perfekt für künstliche Intelligenz ist.“

DeepL: „Wir haben in den letzten zehn Jahren Pionierarbeit bei diesem Computing-Ansatz geleistet, der sich GPU-Computing nennt“, sagte Jensen. „In den letzten sieben oder acht Jahren ging es wirklich in die Turboaufladung, weil das Modell perfekt für künstliche Intelligenz ist.“

DeepL wird zur Konkurrenz für menschliche Übersetzer

Der Übersetzungsdienst aus Köln bietet tatsächlich die beste, flüssigste und am meisten mündlich wirkende Übersetzung. Allerdings scheitert er ebenfalls an „went into turbo charge“, da auch ein hochwertiger KI-Übersetzer mangels übergreifenden Text- und Weltverständnisses lediglich einzelne Formulierungen übersetzen kann. Ein menschlicher Übersetzer hätte hieraus vielleicht so etwas wie „hat sich der Markt unglaublich beschleunigt“ oder „haben wir einen Turbolader verpasst bekommen“ gemacht.

Trotz einiger kleinerer Fehler und Schwierigkeiten mit nicht 1:1 zu übersetzenden Begriffen wie "April Fools' Day" ist DeepL inzwischen zu einer echten Konkurrenz für menschliche Übersetzer geworden. Die Ergebnisse erfordern weniger Zeit bei der Überarbeitung als die der Konkurrenten. Sie sind (meist) aus sich heraus und ohne Referenz auf die Originalquelle gut zu verstehen. Wer nicht zu hohe Anforderungen an eine Übersetzung stellt, der wird die DeepL-Übersetzungen mit wenig Aufwand auch professionell einsetzen können. Dies dürfte vor allem im Bereich von technischen Dokumentationen und Benutzerhandbüchern sinnvoll sein.

Einige nicht so elegante Formulierungen lassen sich dabei verschmerzen. Es kommt eher darauf an, größere Textkonvolute zuverlässig, korrekt und ohne sinnentstellende Fehler einzudeutschen. Allerdings sollten technische Übersetzungen anhand des Originals auf jeden Fall genau überprüft werden. Genau hierbei kann DeepL Pro helfen, denn Übersetzung-Tools wie SDL Trados besitzen Funktionen, mit denen einmal gemachte Korrekturen jederzeit wieder angewendet werden können.

Bildquelle: Thinkstock

Wer sich über die Ergebnisse genauer informieren und sie vergleichen will, findet hier ein Word-Dokument mit den Originaltexten und den Übersetzungen.

©2018 Alle Rechte bei MEDIENHAUS Verlag GmbH