SELEZIONARE LA LINGUA:

A woman interacts with a holographic computer interface

Riepilogo del webinar sull'intelligenza artificiale generativa per i contenuti globali

Panoramica sulle tecnologie dei Large Language Model e dell'intelligenza artificiale generativa e sull'enorme impatto di questi motori sulle attività di localizzazione  

Cosa sono esattamente le tecnologie dell'intelligenza artificiale generativa (GenAI) e dei Large Language Model (LLM)? In che modo l'intelligenza artificiale generativa e gli LLM, come ChatGPT, rivoluzionano le attività di traduzione e localizzazione? Come è possibile usare gli LLM per aggiornare i flussi di lavoro dei contenuti globali?

Vincent Henderson, che dirige i team di Lionbridge che si occupano di prodotti e sviluppo, ha risposto a queste domande e ad altre ancora nel corso del primo di una serie di webinar dedicati all'intelligenza artificiale generativa e ai Large Language Model.

Se avete perso il webinar, potete guardarlo on demand.  

Avete poco tempo? Ecco alcuni degli argomenti trattati da Vincent durante il webinar.

Che cosa sono l'intelligenza artificiale generativa e i Large Language Model?

L'intelligenza artificiale generativa e gli LLM sono motori di intelligenza artificiale che hanno appreso dal corpus di Internet il modo in cui gli esseri umani scrivono i testi. Dato un input, sono in grado di completare un testo specifico con la parte di testo successiva più probabile secondo quanto appreso con l'addestramento.

Queste tecnologie basate sulla nuova intelligenza artificiale creano l'output attingendo a una conoscenza fondata su un'enorme quantità di dati.

Anche se la loro capacità di determinare l'output successivo più plausibile può sembrare banale, in realtà si tratta di un'attività molto sofisticata. Quando il modello riceve il testo, può esaminarlo in modo olistico e cercare di inserirlo in un quadro linguistico globale per produrre un output. Determina ciò che è più importante nell'istruzione e nel corpus usato per l'addestramento, nonché ciò che richiede attenzione.

Gli LLM hanno quindi la straordinaria capacità di produrre testo che sembra essere stato creato da esseri umani. Questa tecnologia pare comprendere il nostro intento e pensare e agire come noi.

Cosa possono fare gli LLM?

In base all'addestramento, un LLM come ChatGPT può fare diverse cose:

  • Risponde alle domande. Se gli fornite un testo che rappresenta una domanda, restituirà il testo che appare più plausibile come risposta.
  • Segue le istruzioni. Se gli fornite una serie di istruzioni, produrrà il risultato più probabile per l'applicazione dell'istruzione.
  • Impara dagli esempi. Se gli fornite alcuni esempi e input con lo stesso formato, elaborerà il testo più plausibile applicando il formato di esempio alle informazioni di input.

Perché gli LLM hanno un impatto così importante sulla traduzione?

Per comprendere cosa rende gli LLM come ChatGPT vantaggiosi per la traduzione e la localizzazione, esaminiamo alcune delle sfide associate alla traduzione automatica neurale (NMT).

Fino a questo momento, le aziende si sono affidate ai motori di traduzione automatica (MT), Large Language Model estremamente specializzati ottimizzati per accettare una stringa di parole e determinare la traduzione corrispondente. Le aziende che usano un motore di traduzione automatica generico con risultati non ottimali possono migliorare tali risultati perfezionando l'addestramento del motore tramite l'uso di decine di migliaia di dati pertinenti.

Si tratta di un processo costoso e le aziende che usano i motori di traduzione automatica devono continuamente valutare se vale la pena ripetere l'addestramento del motore ogni volta che devono avviare un nuovo progetto, ad esempio il lancio di un nuovo prodotto o un'iniziativa di marketing.

Gli LLM invece apprendono il necessario per un'azienda solo da pochi esempi, in quanto questi motori hanno già molte conoscenze. L'apprendimento può essere applicato anche a nuovi ambiti. Di conseguenza, è possibile raggiungere i risultati di traduzione desiderati con un minor numero di istruzioni basate sul contesto e senza l'addestramento di un modello specifico per l'attività, che richiede grandi quantità di dati.

Tuttavia, al momento della stesura di questo documento, gli LLM con queste capacità sono soggetti a una forte pressione derivante da un'elevata domanda e non sono ancora in grado di gestire i volumi di contenuti coinvolti nella localizzazione su scala industriale. Questa situazione è destinata a evolversi presto, ma le tempistiche sono ancora incerte.

Chi traduce meglio: gli LLM o i motori di traduzione automatica?

Come sono le prestazioni della traduzione non elaborata degli LLM rispetto ai risultati dei motori di traduzione automatica? Lionbridge ha messo a confronto la qualità della traduzione prodotta dai principali motori di traduzione automatica e modelli GPT per una frase dall'inglese al cinese, dall'inglese allo spagnolo e dall'inglese al tedesco.

In generale, GPT non offre prestazioni al livello di quelli che attualmente sono i migliori motori di traduzione automatica, ma i risultati degli LLM si avvicinano molto. In un caso, come illustrato nella Figura 1, GPT-4 ha fornito una qualità leggermente migliore rispetto al motore di traduzione automatica Yandex per la combinazione linguistica dall'inglese al cinese.

Confronto della qualità della traduzione automatica tra i modelli GPT e i cinque principali motori di traduzione automatica neurale per la combinazione linguistica dall'inglese al cinese

Per vedere altri risultati comparativi di motori basati su una varietà di lingue e settori, visitate la pagina dedicata allo Strumento di valutazione della traduzione automatica Lionbridge, il metodo usato da più tempo per valutare le prestazioni complessive della traduzione automatica.

In cos'altro differiscono gli LLM come GPT rispetto ai principali motori di traduzione automatica?

Vocabolario, grammatica e precisione

Senza istruzioni specifiche, gli LLM come GPT traducono in modo più gergale rispetto ai principali motori di traduzione automatica. Ciò potrebbe entrare in conflitto con il modo in cui lavorano i traduttori professionisti ed essere considerato un errore. Inoltre, GPT a volte può inventare neologismi, o nuove espressioni, cosa che i traduttori non fanno.

Fare in modo che gli LLM usino una particolare terminologia è facile. Basta chiederglielo. Al contrario, per fare in modo che i motori di traduzione automatica incorporino una terminologia specifica è necessario molto più lavoro, ad esempio l'addestramento del motore di traduzione automatica o la creazione di una sovrastruttura per il motore di traduzione automatica tramite cui inserire la terminologia nei risultati o nel testo di origine. In genere, ciò genera problemi di coniugazione o concordanza.

Poiché GPT ha una conoscenza approfondita della lingua, raramente commetti errori linguistici, ad esempio di concordanza. Se gli viene chiesto, in genere si corregge da solo.

Per quali altri scopi è possibile usare i Large Language Model?

Analisi e miglioramento del testo di origine o di destinazione

Gli LLM sono versatili. È possibile usarli per migliorare non solo il testo di destinazione, ma anche quello di origine. E oltre alle viste quantitative di frequenze, volumi e lunghezze, l'analisi si estende anche alla valutazione qualitativa e ai miglioramenti automatici. È possibile istruire gli LLM a fare le cose in un certo modo per produrre il risultato desiderato.

Potete usare ChatGPT per:

  • Semplificare la terminologia complessa o riscrivere i contenuti in modo più semplice per migliorare la leggibilità e la traducibilità
  • Abbreviare le frasi lunghe senza modificarne il significato per migliorare la leggibilità e la traducibilità

Usando gli LLM per semplificare la leggibilità dei contenuti, potete renderli più accessibili ai destinatari. Migliorando il testo di origine e riducendo il numero di parole, potete abbassare i costi della localizzazione.

Post-editing e controllo della qualità linguistica

Potete chiedere agli LLM di eseguire il post-editing delle vostre traduzioni come fareste con un traduttore professionista. Gli LLM offrono buoni risultati nel post-editing? Un'analisi ha rilevato una riduzione significativa degli sforzi necessari per ottenere la versione finale di una frase, ovvero della distanza di edit, dal 48% al 32%. Gli LLM sono anche in grado di trovare errori come spazi in eccesso, suggerire scelte di parole più adatte e migliorare il testo di destinazione riscrivendolo.

DNA strand

In che modo i fornitori di servizi linguistici come Lionbridge possono supportare gli aggiornamenti ai flussi di lavoro dei contenuti derivanti dall'intelligenza artificiale generativa?

L'intelligenza artificiale generativa cambierà drasticamente i flussi di lavoro per i contenuti multilingue. Lionbridge può fornire servizi associati a questi cambiamenti.

Servizi di generazione di contenuti multilingue

La capacità degli LLM di generare contenuti multilingue sarà senza dubbio la novità più significativa per il mondo della localizzazione dall'introduzione delle memorie di traduzione (TM).

Ecco in che modo gli LLM possono generare contenuti multilingue da zero: fornite informazioni agli LLM e chiedete loro di produrre contenuti derivati in più lingue da zero.

Gli LLM consentiranno alle aziende di generare descrizioni di prodotti, Tweet e altri materiali basati su dati già disponibili, senza rischiare così le cosiddette allucinazioni che gli LLM tendono a produrre quando ponete loro domande relative a cose reali.

Storicamente, i flussi di lavoro dei contenuti globali si sono basati su due flussi separati, uno per la produzione di contenuti locali e uno per la produzione di contenuti globali. Se usate gli LLM, non dovrete produrre contenuti derivati impiegando prima scrittori nella lingua di origine e poi avviando il flusso di lavoro di localizzazione. Produrrete invece il contenuto derivato in tutte le lingue desiderate, quindi sottoporrete a post-editing il testo in ciascuna lingua, inclusa quella locale.

Grazie alla sua ampia comunità di traduttori, Lionbridge può fornire servizi di post-editing multilingue per i contenuti generati in più lingue.

Supporto per le iniziative di intelligenza artificiale generativa multilingue dei clienti

L'uso degli LLM per generare contenuti multilingue richiede un'attenta progettazione delle istruzioni fornite al modello, che può richiedere tempo e che spesso comporta tentativi ed errori. Aiutare le aziende a creare istruzioni adeguate è una nuova categoria di servizi per la localizzazione e un'area in cui Lionbridge può fornire assistenza.

Lionbridge può semplificare l'uso dell'intelligenza artificiale attraverso lo sviluppo del back-end, nonché aiutare i clienti a selezionare il tipo di contenuto da usare per gli esempi e le istruzioni per le iniziative di intelligenza artificiale generativa multilingue che gestiscono autonomamente.

Ottimizzazione degli asset multilingue

GPT può modificare gli asset linguistici, come le memorie di traduzione (TM) e le regole stilistiche.

Lionbridge ha usato GPT-4 per rendere informale un'intera memoria di traduzione (TM) francese, adattando il tono e lo stile alle specifiche del cliente in un modo più conveniente rispetto a quanto possibile in precedenza.

Dati del case study

250

unità di traduzione

4,5

milioni di parole

98,5%

tasso di precisione

Miglioramenti dei flussi di lavoro di localizzazione

Questa categoria riguarda l'uso degli LLM per rendere il post-editing più facile, veloce ed economico e, di conseguenza, per rendere l'intero flusso di lavoro di traduzione più efficace e conveniente.

Il miglioramento dei flussi di lavoro della localizzazione rende più accessibile alle aziende l'idea di localizzare qualsiasi contenuto.

A futuristic circuit board

Conclusione: quali sono le prospettive per il futuro?

Gli LLM avranno un impatto rivoluzionario sulla localizzazione. Nel tempo, i flussi di lavoro si livelleranno.

Invece di lavorare con flussi di lavoro separati per i contenuti locali e per quelli globali, le aziende saranno in grado di definire gli obiettivi, pianificare i contenuti e generarli immediatamente in più lingue.

Nonostante il diffuso timore che le nuove tecnologie possano causare la perdita di posti di lavoro, Lionbridge non è preoccupata per la possibilità che gli LLM mettano in crisi i fornitori di servizi linguistici o riducano la richiesta di traduttori.

Le aziende che usano gli LLM per generare contenuti multilingue avranno comunque bisogno di esperti in materia per rivedere l'output della macchina. Si tratta del lavoro di post-editing per la traduzione automatica. In futuro potremmo chiamarlo in un altro modo.

"L'intero settore linguistico deve rispondere alla sfida presentata dagli LLM. È stimolante. Stiamo per assistere a una moltiplicazione esplosiva dei casi d'uso che la tecnologia LLM può gestire."

- Vincent Henderson, Lionbridge Head of Product, Language Services

Per saperne di più sull'intelligenza artificiale generativa e scoprire come funziona grazie a utili demo, guardate il webinar.

Contattateci

Se volete scoprire come Lionbridge può aiutarvi a gestire in modo più efficiente i contenuti globali usando le tecnologie più recenti, contattateci oggi stesso.

linkedin sharing button

A CURA DI
Janette Mandell
  • #technology
  • #webinar
  • #translation_localization
  • #ai
  • #generative-ai
  • #blog_posts