LANGUE :
LANGUE :
Pôles de connaissances Lionbridge
- Résultats positifs pour les patients
Services de contenu
- Rédaction technique
- Formation et eLearning
- Reporting financier
- Marketing numérique
- Optimisation de contenu
Services de traduction
- Localisation vidéo
- Localisation de logiciels
- Localisation de site Web
- Traduction certifiée
- Interprétation
- Événements en direct
Services de tests
- Assurance qualité fonctionnelle et tests
- Tests de compatibilité
- Tests d'interopérabilité
- Test des performances
- Tests d'accessibilité
- Test utilisateur/client
Solutions
- Modèles de services de traduction
- Traduction automatique
- Smart Onboarding™
- Aurora AI Studio™
Nos pôles de connaissances
- Résultats positifs pour les patients
- Futur de la localisation
- De l'innovation à l'immunité
- Centre de ressources pour la COVID-19
- Série Disruptive
- Engagement patient
- Lionbridge Perspectives
Sciences de la vie
- Pharmaceutique
- Clinique
- Réglementaire
- Post-approbation
- Entreprise
- Dispositifs médicaux
- Validation et clinique
- Réglementaire
- Post-autorisation
- Entreprise
Banque et finance
Vente au détail
Luxe
E-commerce
Lionbridge Games
Automobile
Biens de Consommation
Technologie
Fabrication industrielle
Services juridiques
Tourisme
SÉLECTIONNER LA LANGUE :
En quoi consistent exactement les technologies d'IA générative (GenAI) et de grands modèles de langage (LLM) ? Comment la GenAI et les LLM, comme ChatGPT, vont-ils impacter la traduction et la localisation ? Comment pouvez-vous utiliser les LLM pour améliorer vos flux de travail liés au contenu international ?
Vincent Henderson, responsable des équipes Produit et Développement chez Lionbridge, répond aux questions que vous vous posez.
Vous avez manqué notre webinar, vous pouvez le revoir à la demande.
Vous n'avez pas beaucoup de temps ? Découvrez quelques-uns des thèmes abordés par Vincent au cours du webinar
L'IA générative et les LLM sont des moteurs d'intelligence artificielle (IA) qui apprennent comment les humains rédigent du texte à partir du corpus d'Internet. Si vous leur soumettez une entrée, ils compléteront n'importe quel texte avec la suite la plus probable issue de son entraînement.
Avec la nouvelle IA, ces technologies déterminent le résultat à produire en s'appuyant sur toutes leurs connaissances, fondées sur une immense quantité de données.
Si leur capacité à déterminer le résultat ultérieur le plus plausible peut sembler triviale, la tâche est extrêmement sophistiquée. Lorsqu'il reçoit le texte, le modèle peut l'étudier de manière holistique et déterminer comment il s'intègre à la vision d'ensemble du langage afin de produire le résultat. Il détermine les éléments les plus importants dans l'invite et dans le corpus d'entraînement, et ceux qui doivent faire l'objet d'une attention plus poussée.
Les LLM ont ainsi l'étonnante capacité à produire du texte qui semble avoir été créé par des humains. Cette technologie semble comprendre nos intentions, réfléchir et agir comme nous.
D'après ses apprentissages, un LLM, tel que ChatGPT, peut réaliser plusieurs actions :
Pour comprendre en quoi les LLM comme ChatGPT sont avantageux pour la traduction et la localisation, examinons tout d'abord certaines des difficultés liées à la traduction automatisée lorsque nous utilisons la traduction automatique neuronale (NMT).
À ce jour, les entreprises emploient des moteurs de traduction automatique (MT), des grands modèles de langage hautement spécialisés et optimisés pour prendre une chaîne de termes et en déterminer la traduction correspondante. Les entreprises qui utilisent un moteur MT générique produisant des résultats non optimaux pourraient améliorer ces résultats en affinant l'entraînement du moteur à l'aide de dizaines de milliers de données pertinentes.
Cette opération est coûteuse, et les entreprises qui utilisent des moteurs de MT doivent sans cesse déterminer si le ré-entraînement du moteur mérite les efforts et les dépenses encourus chaque fois qu'elles mettent en place une nouvelle initiative, comme un nouveau lancement de produit ou une nouvelle campagne marketing.
À l'inverse, les LLM apprennent les attentes d'une entreprise uniquement à partir de quelques exemples, étant donné que ces moteurs ont déjà énormément de connaissances. Ils peuvent également appliquer leur apprentissage à de nouvelles initiatives. Ils permettent donc d'obtenir les résultats de traduction souhaités avec des invites beaucoup plus légères tenant compte du contexte, sans un entraînement du modèle spécifique à la tâche et nécessitant de grandes quantités de données.
Cependant, au moment de la rédaction de cet article, les LLM offrant ces fonctionnalités subissent une demande importante, et ils ne peuvent pas encore traiter les volumes de contenu liés à une localisation à l'échelle sectorielle. Cette situation évoluera bientôt, mais nul ne sait quand.
Quelles sont les performances de traduction brutes des LLM par rapport aux moteurs de MT ? Lionbridge a comparé la qualité de la traduction produite par les principaux moteurs de MT neuronale et par les modèles GPT pour une phrase de l'anglais vers le chinois, de l'anglais vers l'espagnol et de l'anglais vers l'allemand.
De manière générale, GPT ne fonctionne pas aussi bien que les meilleurs moteurs de MT actuels. Mais les LLM s'en rapprochent. Dans un exemple, comme le montre la Figure 1, GPT-4 a légèrement surpassé le moteur de MT Yandex pour la paire de langues anglais-chinois.
Pour consulter d'autres résultats comparatifs de moteurs en fonction de différents domaines et langues, visitez le Machine Translation Tracker de Lionbridge, la mesure la plus ancienne des performances globales de la traduction automatique.
Sans instructions spécifiques, les LLM tels que GPT traduisent de manière plus vernaculaire que les principaux moteurs de MT. Cette pratique peut aller à l'encontre de la démarche des traducteurs professionnels et peut être considérée comme une erreur. De plus, GPT peut parfois créer des néologismes ou de nouvelles expressions, chose que les traducteurs évitent.
Il est facile de faire en sorte que les LLM utilisent une terminologie en particulier : il suffit de le leur demander. À l'inverse, il est plus long d'intégrer une terminologie aux moteurs de MT. Il faut entraîner le moteur de MT ou créer une superstructure au-dessus du moteur de MT pour injecter la terminologie dans les résultats ou dans la source. Cette pratique crée généralement des problèmes de conjugaison ou de concordance.
GPT étant très axé sur le langage, il fait rarement des fautes, comme des erreurs de concordance. Généralement, il se corrige lui-même si on le lui demande.
Les LLM sont polyvalents. Vous pouvez les utiliser pour améliorer non seulement le texte cible, mais aussi la source. L'analyse va au-delà des vues quantitatives de fréquences, de volumes et de longueurs, avec une évaluation qualitative et des améliorations automatiques. Demandez aux LLM d'agir d'une certaine manière pour obtenir le résultat souhaité.
Utilisez ChatGPT pour :
L'utilisation des LLM pour faciliter la lecture des contenus les rend plus accessibles au public. L'amélioration de la source et la réduction du nombre de mots peuvent diminuer vos coûts de localisation.
Vous pouvez demander aux LLM de post-éditer vos traductions, comme vous le demanderiez à un traducteur professionnel. Les LLM livrent-ils de bonnes performances en post-édition ? Une analyse a déterminé qu'ils avaient fortement réduit les efforts nécessaires pour obtenir la version finale d'une phrase, ou Edit Distance, de 48 à 32 %. Ils détectent également les erreurs telles que les espaces supplémentaires, suggèrent de meilleurs choix de mots et réécrivent le texte cible pour l'améliorer.
L'IA générative va révolutionner les flux de travail pour le contenu multilingue. Lionbridge peut fournir des services en lien avec ces changements.
La capacité des LLM à générer du contenu multilingue sera sans doute l'évolution la plus importante dans le monde de la localisation depuis le lancement des mémoires de traduction (TM).
Voici comment les LLM peuvent générer du contenu multilingue en partant de zéro : donnez des informations aux LLM. Demandez-leur de produire du contenu dérivé et de produire ce contenu multilingue en partant de zéro.
Les LLM permettront aux entreprises de générer des descriptions de produits, des tweets et d'autres supports en fonction des données que vous possédez déjà. Vous ne risquez donc pas de rencontrer les hallucinations que les LLM ont tendance à produire lorsque vous leur posez des questions sur des éléments réels.
Auparavant, les flux de contenu international étaient basés sur deux flux de travail différents, un pour la production nationale de contenu et l'autre pour la production internationale de contenu. Lorsque vous utilisez des LLM, vous ne produisez pas de contenu dérivé en employant d'abord des rédacteurs dans votre langue source, puis en démarrant votre flux de travail de localisation. Vous produisez le contenu dérivé dans toutes les langues souhaitées, puis vous faites post-éditer le texte par des post-éditeurs dans chaque langue, y compris la vôtre.
Lionbridge occupe une position idéale pour fournir des services de post-édition multilingues, basés sur du contenu généré de manière multilingue, grâce à sa grande équipe de traducteurs.
L'utilisation de LLM pour générer du contenu multilingue requiert une ingénierie en matière d'invites. Or, celle-ci est chronophage et implique la multiplication d'essais et d'erreurs potentielles. Aider les entreprises à créer des invites adaptées est une catégorie de services naissante dans la localisation. Lionbridge peut apporter son aide dans ce domaine.
Lionbridge peut simplifier l'utilisation de l'IA avec un développement backend et peut aider les clients à organiser le type de contenu utilisé en tant qu'exemple, ainsi que les invites pour les initiatives d'IA générative multilingues qu'ils exécutent pour eux-mêmes.
GPT peut modifier les ressources linguistiques, comme les mémoires de traduction (TM) et les règles stylistiques.
Lionbridge a utilisé GPT-4 pour informaliser la totalité d'une mémoire de traduction (TM) française, en adaptant le ton et le style aux spécifications du client, de manière plus abordable que ce qui était possible auparavant.
Cette catégorie concerne l'utilisation de LLM pour rendre la post-édition plus simple, plus rapide et moins chère, et pour rendre finalement tout le flux de traduction plus efficace et économique.
L'amélioration des flux de localisation rend le concept de la localisation plus accessible pour les entreprises.
Les LLM vont transformer la localisation. Au fil du temps, les flux de travail vont se lisser.
Au lieu d'utiliser des flux de travail nationaux et internationaux séparés, les entreprises pourront définir des objectifs de contenu, planifier du contenu et générer du contenu immédiatement en plusieurs langues.
Les nouvelles technologies provoquent souvent la crainte de perdre son travail, mais Lionbridge n'a pas peur que les LLM ne remplacent les prestataires de services linguistiques (LSP) ni les traducteurs.
Les entreprises qui utilisent des LLM pour générer du contenu multilingue auront toujours besoin d'experts pour réviser le contenu de la machine. C'est ce que l'on appelle la post-édition de la traduction automatique. Elle prendra peut-être un autre nom à l'avenir.
« Tout le secteur linguistique doit réagir au défi que présentent les LLM. C'est enthousiasmant. Nous n'en sommes qu'au début d'une multiplication exponentielle des cas d'utilisation que la technologie LLM peut traiter. »
Vincent Henderson, Lionbridge Head of Product, Language Services
Pour en savoir plus sur l'IA générative et la découvrir concrètement dans des démonstrations, regardez le webinaire dès à présent.
Si vous souhaitez découvrir comment Lionbridge peut vous aider à mieux répondre à vos besoins en matière de contenu international grâce aux dernières technologies, contactez-nous dès aujourd'hui.