SÉLECTIONNER LA LANGUE :

Modern technology with bright lights

Classement des langues en fonction de la qualité de la traduction automatique pour une TA plus efficace

Sachez quelles langues sont plus faciles à traduire pour les moteurs avant de déployer la traduction automatique

Alors que les entreprises font face à une pression croissante pour traduire davantage de contenu plus rapidement, la traduction automatique (TA) s'impose comme un facteur essentiel pour relever ce défi. Il est intéressant de comparer les performances des principaux moteurs de TA (Google NMT, Bing NMT, Amazon, DeepL et Yandex) afin de déterminer le moteur qui répondra le mieux à vos besoins. Nous analysons mensuellement les performances des moteurs de traduction automatique via notre MT Tracker, le plus ancien outil d'évaluation des principaux moteurs de TA. Mais il est important d'aller un peu plus loin, d'autant plus que notre analyse indique que les moteurs ont actuellement des performances similaires. 

Pour tirer le meilleur parti de la traduction automatique, envisagez également d'examiner la facilité avec laquelle les moteurs de traduction automatique traduisent certaines paires de langues spécifiques, également connues sous le nom de traductibilité automatique, ou qualité de la traduction automatique, des langues. Pour vous aider à comparer les langues, nous avons classé la qualité de traduction automatique des 28 principales langues cibles à partir de l'anglais dans le Tableau 1.

Pourquoi examiner la qualité de traduction automatique des paires de langues ?

L'identification de la qualité de traduction automatique des paires de langues vous aidera à allouer votre budget lors de la planification des coûts de traduction entre les langues. En effet, vous aurez une meilleure idée des paires de langues qui nécessiteront davantage d'efforts en termes de traduction. 

Cette perspective sur la complexité des langues peut faciliter vos prises de décisions commerciales et vous aider à répondre aux questions suivantes :

  • Dois-je consacrer une partie accrue de mon budget pour la post-édition de paires de langues plus complexes ?
  • La post-édition légère ou la post-édition ciblée, qui ne couvrent que certains aspects critiques du contenu pour la post-édition, suffiront-elles pour certaines langues en cas de budget limité ? Pour quelles langues dois-je utiliser ces méthodes de post-édition ?
  • Mon entreprise doit-elle ajouter le classement des langues aux facteurs commerciaux et culturels lors de l'allocation de son budget, en particulier pour les projets à petit budget ? Si une culture accepte un niveau de qualité inférieur, mon entreprise devrait-elle traduire dans une langue dont le classement de qualité de traduction automatique est faible ?
Digital stream of information

Comment la qualité de traduction automatique est-elle évaluée ?

L'évaluation de la traductibilité automatique des langues n'est pas une tâche aisée. Les défis sont nombreux et varient selon les langues. De plus, ce qui peut être considéré comme une bonne performance pour une langue est considéré comme insuffisant pour une autre. Nous pouvons néanmoins utiliser certaines mesures pour l'évaluation. 

Par exemple, la distance d'édition, qui correspond au nombre de modifications qu'un post-éditeur apporte pour s'assurer que le texte final présente une qualité humaine, peut donner une idée de la complexité de la langue et nous aider à déterminer la traductibilité automatique pour chaque paire de langues, même si ces mesures ne sont généralement pas utilisées pour les comparaisons entre langues. 

Conclusions de Lionbridge sur la traductibilité automatique : comment les langues sont-elles classées et pourquoi ?

Notre classement de traductibilité automatique de 28 langues cibles est basé sur des millions de phrases traitées par Lionbridge. 

Les résultats suggèrent qu'il existe une corrélation entre la complexité et les familles linguistiques.  

Langues romanes

La plupart des langues romanes, telles que le portugais, l'espagnol, le français et l'italien, nécessitent moins de modifications pour atteindre des niveaux de qualité élevés lorsqu'elles sont traduites depuis l'anglais. Nous avons identifié ces langues cibles comme les plus simples à gérer pour les moteurs. Elles occupent donc les quatre premières places de notre classement de traductibilité automatique. 

En particulier, le roumain, l'autre langue de la liste appartenant à la famille des langues romanes, se place plus bas dans le classement, à la dixième place. Cette découverte (pour cette langue romane moins traduite) est probablement due à un corpus bilingue plus petit utilisé pour entraîner les moteurs de traduction automatique et à la complexité grammaticale du roumain, qui présente certaines similitudes avec le latin.   

Chinois simplifié

Le chinois simplifié, une langue très différente de l'anglais, est classé cinquième dans notre liste, immédiatement après les quatre premières langues romanes. Cette position élevée dans le classement, nous l'attribuons aux fréquentes mises à jour et améliorations apportées à la TA pour cette paire de langues au cours des cinq dernières années, comme nous l'avons vu dans notre suivi continu de la TA pour cette période. Les entreprises de traduction automatique investissent davantage dans cette paire de langues afin de générer de meilleures performances en raison de son intérêt commercial élevé. 

Langues complexes

Le hongrois et le finnois, deux langues ouraliennes, comptent parmi les langues plus complexes. Elles figurent aux dernières places de notre classement, soit aux 27e et 28e places. L'estonien, autre langue complexe de la même famille, est classé 24e dans la liste. 

Le coréen est arrivé parmi les dernières places de la liste, au 25e rang de notre classement.

Person working on computer with analytical data

Que pouvons-nous retenir de la traductibilité automatique ?

Si la comparaison entre les langues ait ses limites, notre classement et la corrélation entre la complexité et les familles de langues fournissent des informations intéressantes qui peuvent vous aider à mieux gérer vos projets multilingues.

Tableau 1

Classement de traductibilité automatique des langues

Rang Langue (depuis l'anglais) Rang Langue (depuis l'anglais) Rang Langue (depuis l'anglais)
1 Portugais 11 Thaï 20 Chinois traditionnel
2 Espagnol 12 Norvégien 21 Lituanien
3 Français 13 Allemand 22 Tchèque
4 Italien 14 Suédois 23 Arabe
5 Chinois simplifié 15 Turc 24 Estonien
6 Néerlandais 16 Slovaque 25 Coréen
7 Danois 17 Hébreu 26 Russe
8 Japonais 18 Letton 27 Hongrois
9 Grec 19 Polonais 28 Finnois
10 Roumain        

Tableau 1

Classement de traductibilité automatique des langues

Rang Langue (depuis l'anglais)
1 Portugais
2 Espagnol
3 Français
4 Italien
5 Chinois simplifié
6 Néerlandais
7 Danois
8 Japonais
9 Grec
10 Roumain
11 Thaï
12 Norvégien
13 Allemand
14 Suédois
15 Turc
16 Slovaque
17 Hébreu
18 Letton
19 Polonais
20 Chinois traditionnel
21 Lituanien
22 Tchèque
23 Arabe
24 Estonien
25 Coréen
26 Russe
27 Hongrois
28 Finnois

Nous contacter

Si vous souhaitez en savoir plus sur la façon dont Lionbridge peut vous aider à développer une stratégie de traduction automatique efficace pour répondre à vos besoins de traduction, contactez-nous dès aujourd'hui.

linkedin sharing button
  • #technology
  • #blog_posts
  • #translation_localization

Rafa Moral et Janette Mandell
AUTEUR
Rafa Moral et Janette Mandell