SÉLECTIONNER LA LANGUE :

Finger points to circular rings

Utiliser la terminologie pour améliorer la traduction automatique

Une gestion terminologique de premier ordre peut vous aider à améliorer la qualité de votre traduction automatique.

Les professionnels et le grand public ont de plus en plus recours aux systèmes de traduction automatique (TA) génériques et disponibles gratuitement. Toutefois, il faut garder à l'esprit que ces moteurs peuvent générer des traductions erronées. Une mauvaise qualité ou des erreurs catastrophiques peuvent avoir un impact négatif sur les entreprises. Néanmoins, il existe des moyens de renforcer la qualité de la traduction automatique, notamment en assurant une gestion terminologique efficace de la traduction automatique.

Quel défi la terminologie présente-t-elle pour la traduction automatique ?

En raison des relations complexes entre les concepts et leurs représentations à travers les unités terminologiques, la terminologie demeure l'un des plus grands défis de la traduction automatique.

Dans certains domaines spécifiques, l'utilisation de systèmes de TA gratuits peut notamment entraîner des résultats indésirables d'un point de vue terminologique. L'impact peut être particulièrement néfaste pour les domaines médical et juridique.

Certes, il est possible d'entraîner des systèmes de TA à l'aide d'un corpus de domaine spécifique afin de minimiser la médiocrité des résultats. Toutefois, les systèmes de TA génériques ne garantissent pas toujours une terminologie cohérente ou exacte.

La qualité de la traduction réalisée par un moteur de TA dépend, entre autres, de la qualité du corpus d'entraînement bilingue. Par conséquent, la traduction correcte de la terminologie ne peut être garantie que si le corpus comprend les termes pertinents, aussi bien dans le texte source que dans le texte cible.

Bien que les systèmes de traduction automatique neuronale (NMT) soient basés sur les distributions probabilistes de termes, leur présence est nécessaire mais insuffisante pour produire des traductions de qualité. La fréquence des termes dans le corpus doit être satisfaisante pour que le décodeur obtienne les équivalents exacts. Si la fréquence d'un terme particulier est inadéquate, celui-ci ne pèsera pas suffisamment pour être considéré comme candidat aux équivalences et ne sera pas traduit avec précision.

Une main se tend vers une sphère qui contient des photos de personnes

Comment l'entraînement des moteurs de TA génériques conduit-il à des traductions erronées ?

Les systèmes de TA génériques sont souvent entraînés avec de grands corpus au contenu varié. Par conséquent, le terme candidat le plus fréquent et son éventuel équivalent peuvent appartenir à un domaine différent de celui du terme traduit. Cette situation peut entraîner une traduction inexacte des termes dans la langue cible.

Par exemple, le terme espagnol fósforo peut être traduit par allumette (pour allumer le feu) ou par phosphore (l'élément chimique). Un moteur de TA générique ne sera pas en mesure de discerner facilement l'intention de la phrase et risque de générer une traduction erronée.

La solution à ce problème est d'entraîner des systèmes de TA personnalisés avec des textes bilingues spécifiques à un domaine qui incluent une terminologie spécialisée.

Néanmoins, il est impossible d'obtenir des traductions fiables lorsque les moteurs sont entraînés avec des textes spécialisés où la terminologie n'est pas utilisée de manière cohérente.

Quelles sont les solutions disponibles sur le marché ?

Les recherches dans ce domaine suggèrent d'injecter des informations linguistiques dans les systèmes NMT au moyen de méthodes d'annotation.

La mise en œuvre de l'annotation manuelle ou semi-automatique dépend des ressources disponibles (glossaires. etc.) ainsi que des contraintes (temps, coût, disponibilité des annotateurs humains, etc.).

Quelle est la solution proposée par Lionbridge ?

Smart MT™ de Lionbridge permet d'appliquer des règles linguistiques au texte source et cible, de prendre en compte la terminologie à ne pas traduire (DNT – Do Not Translate) et d'ajouter des listes de glossaires à un profil spécifique.

Nous aidons nos clients à créer et à actualiser des glossaires, ceux-ci étant régulièrement perfectionnés pour inclure de nouveaux termes pertinents et supprimer la terminologie obsolète. Une fois que les glossaires ont été créés dans Smart MT, ils peuvent être utilisés pour tous les moteurs de TA, ce qui permet d'économiser du temps et de l'argent.

Comment utiliser au mieux les glossaires pour les projets de TA ?

L'utilisation de glossaires pour les projets de TA n'est pas aussi simple qu'il n'y paraît. S'ils sont utilisés de manière inappropriée, les glossaires peuvent nuire à la qualité globale de la traduction automatique. La meilleure façon de suivre la terminologie en TA consiste à entraîner la TA.

La combinaison de moteurs de TA entraînés, de personnalisation des glossaires et d'identification des règles de prétraitement et de post-traitement garantit que le résultat de la TA contient la terminologie appropriée et se rapproche, en termes stylistiques, de la documentation du client.

Des points et des cubes tridimensionnels recouvrent un fond sombre

Quelles fonctionnalités de gestion terminologique devriez-vous rechercher dans une solution de traduction automatique ?

Au moment d'évaluer les fonctionnalités de gestion terminologique d'une solution de traduction automatique, veillez à ce que la solution proposée permette de :

  • Gérer les glossaires
  • Gérer les listes de termes à ne pas traduire (DNT : Do Not Translate).
  • Gérer les traductions suggérées et approuvées
  • Transférer des groupes de termes et de phrases via l'importation de glossaires et de mémoires de traduction (MT)
  • Créer des profils de moteur de TA spécifiques à un domaine ou à un produit et automatiser l'acheminement de contenu entre ces moteurs

Ensemble, ces fonctionnalités favoriseront un résultat de traduction de meilleure qualité.

Comment fonctionne la solution Smart MT de Lionbridge ?

Smart MT fonctionne avec divers systèmes de TA tiers via un connecteur. Notre solution pourrait être comparée à un « harnais de TA » à même de :

  • Se connecter aux principaux fournisseurs de TA externes, tels que Microsoft, Google, Amazon, DeepL et Yandex.
  • Gérer la terminologie : des termes de glossaire ou à ne pas traduire (DNT) peuvent être ajoutés et mis à jour à la volée afin de préserver la terminologie et s'assurer qu'elle apparaît exactement comme elle le devrait dans le résultat.
  • Appliquer des règles linguistiques, permettant aux utilisateurs de modifier le texte source ou le résultat de TA pour résoudre les problèmes connus et améliorer la qualité de la TA.

Lionbridge dispose également d'autres automatisations capables d'identifier les incohérences entre la terminologie dans les glossaires des clients et la manière dont cette terminologie est utilisée dans le corpus d'entraînement et dans le résultat de la TA. Ces automatisations permettent d'identifier les cas dans lesquels le corpus d'entraînement ou, par la suite, les résultats de la TA, ne suivent pas la terminologie approuvée et les corrigent.

Si nous apprenons que la TA n'inclut pas la terminologie requise, nous suggérons d'utiliser un glossaire avec les DNT, les noms de produits et la terminologie spécifique du domaine clé ou de la marque.

Y a-t-il des conseils supplémentaires pour la création et l'utilisation d'un glossaire ?

Pour garantir le résultat de traduction automatique souhaité, nous vous recommandons de suivre les instructions suivantes lorsque vous créez vos glossaires :

  • N'incluez dans vos glossaires que les termes qui peuvent être utilisés systématiquement chaque fois que le terme source apparaît, ce qui s'applique souvent à la terminologie spécialisée, au vocabulaire approuvé par le client et aux termes techniques.
  • N'utilisez qu'une seule ligne de traduction dans votre glossaire lorsqu'il existe plusieurs traductions pour un même terme source.
  • Utilisez principalement des phrases nominales. Cela fonctionne mieux avec les termes composés, les termes spécifiques à un secteur ou les noms de produits spécifiques au client.
  • Évitez l'utilisation de termes généraux ou courants car la présence de nombreuses entrées terminologiques dans une même phrase peut avoir un impact sur la qualité de la traduction.

Nous contacter

Si vous souhaitez en savoir plus sur la manière dont Lionbridge peut vous aider à gérer votre terminologie et à tirer le meilleur parti de la traduction automatique, contactez-nous dès aujourd'hui.

linkedin sharing button

Yolanda Martin et Janette Mandell
AUTEUR
Yolanda Martin et Janette Mandell
  • #technology
  • #blog_posts
  • #translation_localization