SÉLECTIONNER LA LANGUE :

Two separate sets of couples collaborate in a work setting

Personnalisation et entraînement de la traduction automatique

Quand utiliser l'une ou l'autre approche pour améliorer la qualité de la traduction automatique

Les entreprises se tournent plus que jamais vers la traduction automatique (TA), et elles devraient être de plus en plus nombreuses à le faire. Cette tendance est due aux résultats de plus en plus prévisibles de cette technologie, ainsi qu'à la pression intense du marché pour la production rapide de plus de contenu dans de nombreuses langues, avec le même budget, voire un budget plus limité. La technologie de TA fournit des traductions avec plus de rapidité et à moindre coût que les traducteurs humains. Toutefois, elle expose également les entreprises à des problèmes de qualité. Pour réussir sur des marchés toujours plus numérisés, les entreprises doivent fournir un contenu multilingue personnalisé qui soit spécifique à un domaine, qui adopte un ton particulier et cohérent sur tous les canaux de la marque.

Comment valoriser au maximum votre TA pour honorer ces objectifs ? Deux méthodes permettent de renforcer l'efficacité de la traduction automatique : la personnalisation de la TA et l'entraînement de la TA. Ces approches tendent toutes deux à améliorer la qualité de la TA et à réduire le besoin de post-édition. Pourtant, les entreprises ne peuvent pas les utiliser de façon interchangeable.

Poursuivez votre lecture afin de savoir comment fonctionnent ces méthodes, en quoi elles sont différentes et comment sélectionner la bonne approche en fonction de vos besoins.

Pourquoi une entreprise ne peut-elle pas se fier uniquement à une TA générique ?

Les entreprises obtiennent généralement les résultats souhaités lorsqu'elles utilisent la TA pour un contenu général et simple à partir de moteurs génériques et non entraînés, tels que Google NMT, Bing NMT, Amazon, DeepL ou Yandex. Cependant, la qualité peut s'avérer insuffisante.

Pourquoi ? Un moteur générique est souvent incapable de traduire un contenu hautement spécialisé, par exemple en sciences de la vie ou dans le domaine juridique, et de restituer la terminologie associée à ces domaines spécifiques. Il n'est pas capable de déterminer quand appliquer, de façon adéquate, la définition correcte d'un mot ayant plusieurs sens. Il n'est pas non plus en mesure de préserver le ton particulier de votre marque et de déterminer quand choisir un langage formel ou informel pour communiquer au mieux avec votre audience.

La personnalisation de la TA et l'entraînement de la TA comblent ces lacunes et permettent d'améliorer la qualité de la traduction en cas d'exigences spécifiques auxquelles les moteurs génériques ne répondent pas.

Qu'est-ce que la personnalisation de la TA ?

La personnalisation de la TA consiste à adapter un moteur de traduction automatique à un glossaire de traduction et à une liste de termes à ne pas traduire (DNT – Do Not Translate) dans le but d'améliorer la précision des traductions générées. (Le glossaire de traduction regroupe les termes importants du jargon de l'entreprise ainsi que leurs traductions. La liste DNT énumère les termes à laisser dans leur langue originale.)

Pour la personnalisation de la TA, une liste de ces termes avec leurs traductions va donc être importée avant que le moteur n'exécute son travail. La liste indique au moteur de TA comment traduire les termes ou empêche intentionnellement leur traduction. Cette intervention améliore les suggestions du moteur et permet à l'entreprise de conserver le nom de sa marque, de respecter la terminologie et de produire des variantes régionales. Plus la qualité est bonne, moins les traductions nécessitent de post-édition.

Même si la personnalisation de la TA est généralement plus facile à exécuter que l'entraînement de la TA, cette approche impose quelques mises en garde. L'importation de termes dans un système de traduction automatique est un processus simple en soi. Par contre, il est parfois complexe de sélectionner les termes corrects. Le succès de la personnalisation de la TA dépend fortement du niveau de compétence de l'expert en TA et de sa capacité à gérer les règles de normalisation des entrées et des sorties, les listes DNT et les glossaires, qui contribuent tous à améliorer la qualité produite. Des auteurs inexpérimentés peuvent, par inadvertance, amener la TA à formuler de mauvaises suggestions et nuire à la qualité globale de la traduction.

Qu'est-ce que l'entraînement de la TA ?

L'entraînement de la TA est un processus qui implique la création et la formation d'un moteur de TA à l'aide d'une grande quantité de données bilingues issues de corpus de textes et de mémoires de traduction (contenus précédemment traduits) dans le but d'améliorer la précision des traductions générées.

Il consiste à alimenter le moteur de TA générique en y incorporant des corpus bilingues spécifiques à l'entreprise. Il s'effectue au moyen d'entrées via diverses exportations, la plupart du temps sous la forme de mémoires de traduction (MT). En plus de fournir la traduction précédemment approuvée, la mémoire de traduction contient de précieuses données de type méta, telles que le moment où la phrase a été traduite, par qui et s'il s'agit d'une correspondance exacte ou approximative. Ces données permettent au moteur d'apprendre ce que l'entreprise attend de la traduction. Au lieu de formuler une suggestion de traduction générique aléatoire de la source, il génère un résultat personnalisé basé sur les corpus.

L'entraînement de la TA permet à une entreprise d'affiner la qualité de façon à obtenir un ton ou un style de marque spécifique grâce à la capacité du moteur à produire des traductions plus cohérentes. Celui-ci donne dès lors la possibilité de contourner le paramètre par défaut des moteurs de TA génériques au ton formel et d'obtenir des textes au ton informel. Comme avec la personnalisation de la TA, une entreprise obtiendra les résultats souhaités avec moins de post-édition, dans la mesure où le moteur est plus apte à générer des traductions précises avec moins d'erreurs.

Pendant l'entraînement de la TA, l'entreprise fournit au moteur autant de connaissances que possible : des segments de haute contribueront à un résultat de meilleure qualité. Pour réussir, ce processus nécessite que l'entreprise fournisse, au minimum, 15 000 segments bilingues de haute qualité et exempts d'incohérences et de doublons de la traduction source. Faute de satisfaire ces exigences minimales, l'entraînement n'influera probablement pas sur les résultats de manière majeure, ni même de quelque manière que ce soit.

Quelle est la différence entre la personnalisation et l'entraînement de la TA ?

Si ces approches contribuent toutes deux à améliorer la qualité de la TA et à réduire le travail de post-édition, les similitudes s'arrêtent là. Elles ne sont pas interchangeables.

Les méthodes diffèrent de la manière suivante : la personnalisation de la TA adapte un moteur de TA préexistant avec des glossaires et des listes de termes à ne pas traduire (DNT), tandis que l'entraînement de la TA construit et entraîne le moteur à partir de zéro grâce à de nombreuses données bilingues provenant de corpus et de mémoires de traduction.

La personnalisation est davantage polyvalente que l'entraînement de la TA et génère des suggestions qui répondent aux exigences de la plupart des entreprises. La personnalisation, qui consiste à mettre à jour le profil du moteur de TA, entraîne toutefois un coût unique. La tenue d'un glossaire au fil du temps engendre des coûts supplémentaires.

L'entraînement de la TA est la méthode la plus appropriée pour les entreprises sophistiquées avec un contenu hautement spécialisé et des cas d'utilisation complexes. L'entraînement de la TA induit, quant à lui, des coûts liés à l'entrée initiale des corpus, puis d'éventuels coûts pour un entraînement postérieur si le suivi des performances de la TA indique une potentielle marge d'amélioration.

A geographic pattern overlays a cityscape at night

Quand mon entreprise devrait-elle envisager d'entraîner la TA plutôt que de la personnaliser ?

Votre entreprise doit-elle traduire des documents scientifiques ou des manuels hautement techniques ? Avez-vous besoin de préserver le ton unique de votre marque ? Les réponses à ces questions détermineront la méthode qui convient : la personnalisation ou l'entraînement de la TA.

Quand choisir la personnalisation de la TA

La personnalisation de la TA convient particulièrement à deux cas d'utilisation principaux. Elle est préférable pour atteindre les objectifs suivants :

  • Garantir des traductions terminologiques précises
  • Tenir compte de variante régionales, telles que l'anglais américain et l'anglais britannique, sans disposer de données suffisantes pour l'entraînement

La personnalisation de la TA représente un choix judicieux pour les contenus technologiques ou très précis, dans la mesure où la traduction correcte de la terminologie pour ce type de contenu est essentielle. La personnalisation de la TA est l'approche à privilégier lorsque vous manquez de données suffisantes pour un entraînement efficace de la TA.

Quand choisir l'entraînement de la TA

L'entraînement de la TA convient particulièrement à deux cas d'utilisation principaux. Il est préférable pour atteindre les objectifs suivants :

  • Garantir une voix, un ton ou un style de marque spécifique, tout en réduisant les besoins de post-édition
  • Tenir compte de variantes régionales dans une langue cible, comme le français de Suisse par rapport au français de France, à condition de disposer de suffisamment de données pour l'entraînement

L'entraînement de la TA est un choix judicieux pour la traduction de contenu marketing et créatif, dans la mesure où la voix, le ton et le style spécifiques à la marque sont des éléments essentiels de ce type de contenu. Cependant, assurez-vous de posséder suffisamment de données pour entraîner les moteurs de façon efficace.

Approche hybride

Parfois, une approche hybride produit les meilleurs résultats. Par exemple, la TA peut générer de meilleures suggestions lorsque les entreprises renforcent l'entraînement de la TA avec un certain degré de personnalisation.

Lionbridge permet à ses clients de mettre en œuvre une approche hybride en toute simplicité. Les clients peuvent personnaliser leur TA au moyen de la solution de TA professionnelle de Lionbridge, Smart MT™ Portal, tout en optant pour l'achat de services d'entraînement professionnel par les équipes qualifiées de Lionbridge. Lorsqu'elles travaillent avec ces équipes, les entreprises abordent généralement la TA de manière plus holistique et combinent souvent l'entraînement et la personnalisation de la TA pour obtenir des résultats optimaux. Divers tests leur permettent de mieux comprendre ce qui donne les meilleurs résultats et d'adopter une approche de la TA sur mesure.

Personnalisation ou entraînement de la TA : quelle est la meilleure stratégie ?

Le choix de la meilleure approche pour améliorer la qualité de la TA dépend de votre situation. Face aux options disponibles, il peut être tentant de considérer l'entraînement de la TA comme première et unique méthode pour valoriser au maximum votre TA. Il se peut aussi que vous soyez intrigué par l'effet de mode autour de l'entraînement continu. Voici quelques éléments à garder à l'esprit.

Éviter le piège n°1 : l'entraînement de la TA comme seule et unique solution

L'entraînement de la TA peut être un outil très efficace pour améliorer la qualité de la TA, mais seulement lorsqu'il répond à des objectifs identifiés et ciblés.

Avec l'utilisation accrue de la TA, de nombreux fournisseurs font de l'entraînement de la TA leur solution de prédilection pour essayer d'apporter une plus-value à leurs clients. Cependant, dans certains cas, cette approche peut se retourner contre vous. Après avoir tout misé sur l'entraînement pour améliorer leur TA, diverses entreprises, déçues par les résultats et à la lumière d'une analyse coûts-avantages, ont ensuite eu recours aux services de Lionbridge. Les suggestions générées par le moteur n'étaient pas toujours fiables et elles recherchaient une solution plus rentable. Pourquoi étaient-elles insatisfaites ? En somme, au vu de leurs circonstances particulières, il existait de meilleures approches.

Les fournisseurs de TA innovants, comme Lionbridge, recourent à l'entraînement de la TA lorsque cela est nécessaire, mais s'appuient fortement sur la personnalisation afin d'optimiser la qualité de la TA, à un coût inférieur à celui de l'entraînement de la TA.

Éviter le piège n°2 : l'effet de mode autour de l'entraînement continu de la TA

Dans votre recherche de solutions de TA, vous pourriez vous trouver face à certains fournisseurs mettant en avant le concept de moteurs entraînés en continu après chaque projet. Méfiez-vous de telles allégations. L'entraînement continu n'est possible que si vous avez affaire à des moteurs sur mesure qui nécessitent une mise à jour constante.

Nous tenons à souligner que l'entraînement de la TA réussira seulement si un projet particulier comporte au moins 15 000 segments distincts pour entraîner le moteur. Lorsque les entreprises ne disposent pas de suffisamment de données, elles peuvent utiliser le contenu du projet pour mettre à jour les fonctionnalités de personnalisation, appelées « entraînement » dans de nombreux cas.

En un mot

La personnalisation est un outil plus polyvalent que l'entraînement de la TA. Elle génère des suggestions de TA qui répondent aux exigences de la plupart des entreprises. Avec la personnalisation, vous pouvez suffisamment améliorer les suggestions de TA afin de maintenir le nom de votre marque et en respecter la terminologie, réduisant ainsi le travail de post-édition pour vérifier ces éléments. Les coûts ponctuels liés à la mise à jour du profil rattaché au moteur de TA et certains coûts permanents liés à la tenue du glossaire au fil du temps restent généralement inférieurs aux coûts associés à l'entraînement de la TA.

A geographic pattern overlays a cityscape at night

Quelles sont les meilleures pratiques en matière de personnalisation de la TA ?

Lors de la personnalisation de la TA, assurez-vous de respecter les meilleures pratiques suivantes :

Règles de normalisation des entrées et des sorties

Mettez en place une bibliothèque de règles de normalisation des entrées et des sorties pour les langues les plus utilisées afin de contrôler les importations dans la TA et d'en améliorer la qualité. Ces règles vous permettront de répondre à vos besoins spécifiques.

Par exemple, une règle de normalisation des entrées peut contraindre le moteur de traduction automatique à utiliser des chevrons [« … »] plutôt que des guillemets droits [“...”] dans les traductions françaises. Cette règle améliore la qualité des traductions françaises. En effet, les lecteurs francophones s'attendent à voir des chevrons plutôt que des guillemets droits. Les entreprises peuvent, grâce à des règles de normalisation des entrées et des sorties, permettre également de telles modifications en cas de variantes linguistiques régionales pour les langues parentes, telles que le français de Belgique, le français du Québec ou le français d'Afrique.

Règles et listes concernant les termes à ne pas traduire

Dressez une liste des termes à conserver dans la langue source et mettez en place une règle qui remplace tout terme à ne pas traduire (DNT) identifié par un jeton avant de le soumettre au moteur. Cette action rendra le terme invisible pour le moteur et empêchera sa traduction. Une fois la traduction traitée et la suggestion de TA renvoyée, définissez la règle de normalisation de sortie pour remplacer le jeton par le terme DNT.

Préparation du glossaire

Préparez soigneusement votre glossaire afin de favoriser des traductions précises et cohérentes. Tenez compte des facteurs clés indiqués dans le tableau 1 pour inclure ou non un terme dans votre glossaire.

Directives générales de compilation d'un glossaire

Considérations Que demander Le terme doit-il être inclus dans le glossaire ?*
Fréquence À quelle fréquence le terme apparaît-il dans le texte source ? Si le terme apparaît rarement, ne l'incluez pas.
Ambiguïté Le terme a-t-il plusieurs sens ou peut-il être facilement confondu avec d'autres mots ? Si le terme est ambigu, incluez-le. (Remarque : les autres significations du terme doivent apparaître rarement dans le texte source.)
Terminologie spécialisée Le terme est-il spécifique à un domaine ou à un sujet particulier ? Si oui, incluez-le.
Cohérence Le terme a-t-il été traduit de manière cohérente dans le passé ? Si oui, ne l'incluez pas.
Importance Quelle est l'importance du terme dans le sens général du texte ? S'il est essentiel au sens du texte, incluez-le.
Complexité Le terme est-il complexe et le système de traduction automatique aura-t-il du mal à le traduire avec précision ? Si oui, incluez-le.

Tableau 1. Facteurs à prendre en compte lors de la création d'un glossaire.

*Ces directives générales peuvent présenter certaines exceptions.

À faire et à éviter

Voici quelques conseils et mises en garde concernant la création d'un glossaire :

  • N'incluez pas de termes génériques (tels que des mots simples, des verbes et des adjectifs) qui ne fonctionnent pas bien avec la traduction automatique et qui peuvent avoir un impact négatif sur la qualité générale, la construction des phrases, l'accord et l'ordre des mots
  • Ne fractionnez pas les termes longs
  • N'incluez pas de termes contradictoires
  • N'incluez pas d'entrées en double
  • Utilisez une seule entrée de terme par langue source
  • Incluez les expressions à plusieurs mots
  • Incluez les noms de produits spécifiques
  • Indiquez les termes DNT

Comment Lionbridge aborde-t-elle la personnalisation et l'entraînement de la TA ?

Le portail Smart MT de Lionbridge permet à nos clients, grâce à notre technologie, de mettre en œuvre la personnalisation de la TA de façon simple et simultanée sur plusieurs moteurs de TA. Après avoir compilé vos glossaires de TA et vos listes DNT et importé l'ensemble de ces termes, ceux-ci seront utilisés par chaque moteur de TA. La technologie vous évite de vous limiter à un seul moteur. Vous pouvez en changer à tout moment afin d'obtenir les meilleurs résultats.

En outre, il est facile de compléter notre technologie de TA par des services pertinents fournis par nos experts en TA. Une fois engagés, nous aidons les entreprises à identifier la stratégie de traduction automatique la plus efficace et la meilleure façon d'exécuter cette stratégie.

Que vous commenciez tout juste à explorer l'utilisation de la TA, que vous souhaitiez améliorer votre TA actuelle grâce à la personnalisation ou que l'entraînement de la TA devienne une approche viable en raison de la croissance de votre création de contenu, nous avons la solution qui répond à vos besoins.

Quelles sont les différences entre l'entraînement et la personnalisation de la traduction automatique ?

En un coup d'œil, comparez l'entraînement et la personnalisation de la TA dans le tableau 2 pour savoir quelle méthode convient le mieux à votre contenu.

Personnalisation et entraînement de la traduction automatique

  Personnalisation de la TA Entraînement de la TA
Qu'est-ce que c'est et comment ça marche Adaptation d'un moteur de traduction automatique préexistant avec un glossaire de traduction et à une liste de termes à ne pas traduire (DNT – Do Not Translate) dans le but d'améliorer la précision des traductions générées. Création et entraînement d'un moteur de TA au moyen de nombreuses données bilingues, issues de corpus et de mémoires de traduction (MT), dans le but d'améliorer la précision des traductions générées.
Objectif Améliore les suggestions de la TA pour des résultats plus précis et réduit la nécessité de post-édition Améliore les suggestions de la TA pour des résultats plus précis et réduit la nécessité de post-édition
Avantages spécifiques Permet aux entreprises d'adhérer à leur marque et à leur terminologie mais aussi de produire des variantes régionales Permet aux entreprises de conserver une voix, un ton et un style de marque spécifiques et de produire des variantes régionales
Risques Lorsqu'elle n'est pas exécutée correctement, la TA peut formuler de mauvaises suggestions et avoir un impact négatif sur la qualité globale Si les données de qualité sont insuffisantes pour entraîner le moteur, l'entraînement de la TA risque de n'avoir aucun impact sur le résultat ; si des auteurs inexpérimentés font un usage inapproprié de la terminologie. la TA risque de formuler de mauvaises suggestions et d'avoir un impact négatif sur la qualité globale
Utilisation Solution idéale pour le contenu technologique et axé sur les détails et tout contenu nécessitant :
*Des traductions précises de la terminologie
*Des variantes régionales, lorsque vous manquez de données suffisantes pour l'entraînement de la TA
Solution idéale pour le contenu hautement spécialisé, le marketing et le contenu créatif, et tout contenu nécessitant :
*Une voix, un ton ou un style de marque spécifique
*Des variantes régionales, lorsque vous avez suffisamment de données pour l'entraînement de la TA
Facteurs de succès Un spécialiste expérimenté en TA, capable de gérer avec succès les règles de normalisation des entrées et des sorties, les glossaires et les listes DNT Un minimum de 15 000 segments distincts pour entraîner correctement le moteur
Coûts Prévoyez un coût unique pour mettre à jour le profil qui entre dans le moteur de TA et des coûts permanents pour la tenue d'un glossaire au fil du temps ; les coûts sont relativement peu élevés si l'on tient compte des avantages potentiels et sont généralement inférieurs aux coûts d'entraînement de la TA Prévoyez des coûts liés au premier entraînement, ainsi que des coûts potentiels pour tout entraînement supplémentaire, qui peuvent être envisagés au fil du temps si le contrôle des performances de la TA indique une marge d'amélioration ; l'entraînement de la TA peut valoir l'investissement dans certains cas si l'on tient compte des avantages potentiels.

Tableau 2. Comparaison entre la personnalisation et l'entraînement de la TA

Nous contacter

Si vous souhaitez en savoir plus sur la façon dont nous pouvons vous aider à tirer pleinement parti de la traduction automatique, contactez-nous dès aujourd'hui.

linkedin sharing button

Thomas McCarthy et Janette Mandell
AUTEUR
Thomas McCarthy et Janette Mandell
  • #ai
  • #blog_posts
  • #translation_localization