Modern technology with bright lights

Ranking der Sprachen zur maschinellen Übersetzbarkeit für eine effektivere MT

Klarer Vorteil: Kenntnis der Sprachen, die sich am besten für die maschinelle Übersetzung eignen, bevor MT zum Einsatz kommt

Da Unternehmen zunehmend unter Druck stehen, ihren Content schneller übersetzen zu müssen, erweist sich die maschinelle Übersetzung (Machine Translation, MT) als wesentliche Komponente, um diese Herausforderung zu meistern. Es lohnt sich, die Leistung der wichtigsten MT-Engines – Google NMT, Bing NMT, Amazon, DeepL und Yandex – zu vergleichen, um festzustellen, welche davon Ihren Anforderungen am besten gerecht wird. Tatsächlich analysieren wir auch monatlich die Ergebnisse der unterschiedlichen MT-Engines in unserem MT Tracker, dem am längsten eingesetzten Messinstrument für MT-Engines. Es ist jedoch wichtig, gezielt weitere Bewertungen vorzunehmen. Unsere Analyse zeigt nämlich, dass die Leistungen der großen Engines sich derzeit kaum etwas nehmen. 

Um den größtmöglichen Nutzen aus der MT zu ziehen, sollten Sie auch untersuchen, wie gut die maschinelle Übersetzung für bestimmte Sprachpaare geeignet ist. Diese Bewertung wird auch als maschinelle Übersetzbarkeit oder M-Übersetzbarkeit (m-translatability) bezeichnet. Um Ihnen den Vergleich von Sprachen zu erleichtern, haben wir in Tabelle 1 die M-Übersetzbarkeit der 28 wichtigsten Zielsprachen mit der Quellsprache Englisch aufgelistet.

Was hat es mit der M-Übersetzbarkeit von Sprachpaaren auf sich?

Die Ermittlung der M-Übersetzbarkeit von Sprachpaaren hilft Ihnen, Ihr Budget bei der Planung der Übersetzungskosten für die verschiedenen Sprachen zuzuweisen. Damit haben Sie eine bessere Vorstellung davon, welche Sprachpaare einen höheren Übersetzungsaufwand erfordern. 

Ein Einblick in die Sprachkomplexität kann Ihre Geschäftsentscheidungen unterstützen und Antworten auf die folgenden Fragen geben:

  • Soll ein größerer Teil des Budgets für das Post-Editing komplexerer Sprachpaare verwendet werden?
  • Ist ein einfaches oder gezieltes Post-Editing, bei dem nur kritische Bereiche des Inhalts editiert werden, für einige Sprachen ausreichend, wenn das Budget knapp ist? Für welche Sprachen sollte ich diese Post-Editing-Methoden anwenden?
  • Sollte mein Unternehmen neben geschäftlichen und kulturellen Faktoren auch das Ranking der Sprachen berücksichtigen, wenn es um den optimalen Einsatz des Budgets geht, insbesondere bei Projekten mit geringem Budget? Sollte mein Unternehmen in eine Sprache mit einer niedrigen M-Übersetzbarkeit übersetzen lassen, wenn die relevanten Zielgruppen ein geringeres Qualitätsniveau akzeptieren?
Digital stream of information

Wie wird die M-Übersetzbarkeit ermittelt?

Die Ermittlung der Übersetzbarkeit von Sprachen ist kein einfacher Prozess. Es gibt eine Vielzahl von Unwägbarkeiten, die sich von Sprache zu Sprache unterscheiden. Was für die eine Sprache als gutes Ergebnis gilt, kann für eine andere als unzureichend betrachtet werden. Dennoch gibt es einige Metriken für eine allgemeine Bewertung. 

So kann etwa die Bearbeitungsdistanz, d. h. die Anzahl der Änderungen, die im Zuge des Post-Editing vorgenommen werden, um sicherzustellen, dass der endgültige Text eine professionelle Qualität hat, ein Gefühl für die Komplexität der Sprache vermitteln. Das hilft uns, die M-Übersetzbarkeit für jedes Sprachpaar zu bestimmen, auch wenn diese Metriken normalerweise nicht für sprachübergreifende Vergleiche herangezogen werden. 

Das Ranking der M-Übersetzbarkeit von Lionbridge: Die Platzierung von Sprachen und die Gründe dafür

Unsere Rangliste von 28 Zielsprachen basiert auf Millionen von Sätzen, die Lionbridge verarbeitet hat. 

Die Ergebnisse deuten darauf hin, dass es eine Korrelation zwischen Komplexität und Sprachfamilien gibt.  

Die romanischen Sprachen

Die meisten romanischen Sprachen, wie z. B. Portugiesisch, Spanisch, Französisch und Italienisch, erfordern weniger Änderungen, um bei der Übersetzung aus dem Englischen ein hohes Qualitätsniveau zu erreichen. Wir haben festgestellt, dass diese Zielsprachen für die Engines am einfachsten zu handhaben sind. Daher belegen sie auch die ersten vier Plätze in unserem Ranking der M-Übersetzbarkeit. 

Bemerkenswert ist, dass Rumänisch, als weiterer Vertreter dieser Sprachfamilie, in der Rangfolge weiter unten an zehnter Stelle steht. Dieses Ergebnis – für die weniger häufig übersetzte romanische Sprache – ist wahrscheinlich auf einen nicht so umfangreichen zweisprachigen Trainingskorpus zurückzuführen, der zum Trainieren von MT-Engines eingesetzt wird; außerdem auf die grammatikalische Komplexität des Rumänischen, das Ähnlichkeiten mit dem Lateinischen aufweist.   

Vereinfachtes Chinesisch

Diese Variante des Chinesischen unterscheidet sich zwar grundlegend vom Englischen, steht auf unserer Liste aber dennoch an fünfter Stelle, unmittelbar nach den vier romanischen Sprachen. Wir führen diese hohe Platzierung auf die häufigen Aktualisierungen und Verbesserungen der MT für dieses Sprachenpaar in den letzten fünf Jahren zurück, wie wir in unserem kontinuierlichen Tracking für diesen Zeitraum festgestellt haben. Unternehmen im Bereich der maschinellen Übersetzung investieren verstärkt in dieses Sprachenpaar, um aufgrund des großen geschäftlichen Interesses bessere Ergebnisse zu erzielen. 

Komplexe Sprachen

Ungarisch und Finnisch, zwei uralische Sprachen, sind äußerst komplex und landen in unserer Rangliste daher ganz unten auf den Plätzen 27 und 28. Dasselbe gilt für Estnisch, das ebenfalls zur Familie der uralischen Sprachen gehört und Platz 24 belegt. 

Koreanisch liegt am unteren Ende der Liste und belegt Platz 25 in unserem Ranking.

Person working on computer with analytical data

Welche Schlüsse ziehen wir aus der M-Übersetzbarkeit?

Der Vergleich von Sprachen hat zwar seine Grenzen, doch unser Ranking und die Korrelation zwischen Komplexität und Sprachfamilien bieten interessante Einblicke, die Ihnen dabei helfen können, Ihre mehrsprachigen Projekte besser umzusetzen.

Tabelle 1

Rangliste der M-Übersetzbarkeit von Sprachen

Rang Sprache (aus dem Englischen) Rang Sprache (aus dem Englischen) Rang Sprache (aus dem Englischen)
1 Portugiesisch 11 Thailändisch 20 Chinesisch (traditionell)
2 Spanisch 12 Norwegisch 21 Litauisch
3 Französisch 13 Deutsch 22 Tschechisch
4 Italienisch 14 Schwedisch 23 Arabisch
5 Chinesisch (vereinfacht) 15 Türkisch 24 Estnisch
6 Niederländisch 16 Slowakisch 25 Koreanisch
7 Dänisch 17 Hebräisch 26 Russisch
8 Japanisch 18 Lettisch 27 Ungarisch
9 Griechisch 19 Polnisch 28 Finnisch
10 Rumänisch        

Tabelle 1

Rangliste der M-Übersetzbarkeit von Sprachen

Rang Sprache (aus dem Englischen)
1 Portugiesisch
2 Spanisch
3 Französisch
4 Italienisch
5 Chinesisch (vereinfacht)
6 Niederländisch
7 Dänisch
8 Japanisch
9 Griechisch
10 Rumänisch
11 Thailändisch
12 Norwegisch
13 Deutsch
14 Schwedisch
15 Türkisch
16 Slowakisch
17 Hebräisch
18 Lettisch
19 Polnisch
20 Chinesisch (traditionell)
21 Litauisch
22 Tschechisch
23 Arabisch
24 Estnisch
25 Koreanisch
26 Russisch
27 Ungarisch
28 Finnisch

Nehmen Sie Kontakt mit uns auf

Wenn Sie mehr darüber erfahren möchten, wie Lionbridge Sie bei der Entwicklung einer effektiven MT-Strategie für Ihre Übersetzungsanforderungen unterstützen kann, kontaktieren Sie uns noch heute.

linkedin sharing button
  • #technology
  • #blog_posts
  • #translation_localization

Rafa Moral und Janette Mandell
VERFASSER
Rafa Moral und Janette Mandell