Machine translation e traduzione

Note di riferimento: terminologia relativa alla traduzione automatica, dall'intelligenza artificiale ai Large Language Model e oltre

Ultimo Aggiornamento: 14 dicembre, 2023 17:38

A decenni dalla sua nascita, la traduzione automatica (MT) sta registrando una crescita vertiginosa. I progressi nei Large Language Model (LLM), in particolare, suscitano ogni giorno nuovo entusiasmo da parte del pubblico ma anche degli addetti ai lavori.

Negli ultimi anni, l'intelligenza artificiale è entrata decisamente a far parte dell'immaginario collettivo; oggi tutti parlano dell'intelligenza artificiale generativa (GenAI) come una delle novità più interessanti per diversi settori. Anche se non utilizzate direttamente la traduzione automatica, è importante sapere di cosa parliamo.

Man mano che l'intelligenza artificiale è diventata più accessibile ad aziende e consumatori, sono emersi nuovi termini correlati. Se siete estranei al settore, come riuscite a capire la differenza tra termini talvolta utilizzati in modo interscambiabile?

Come traducete machine translation?

Siamo qui per aiutarvi. In Lionbridge possiamo contare su alcuni dei maggiori esperti di traduzione automatica al mondo. Abbiamo collaborato con loro allo sviluppo di queste note di riferimento per spiegarvi in modo chiaro le differenze, più o meno evidenti, tra i termini che dominano il settore.

CONTATTATECI

1. Intelligenza artificiale

Per comprendere le tendenze recenti nella traduzione automatica, è importante acquisire familiarità con il concetto di base: la straordinaria intelligenza artificiale. L'intelligenza artificiale è, in sostanza, "l'intelligenza" che le macchine dimostrano quando svolgono alcune attività generalmente considerate frutto del pensiero umano, come l'apprendimento e la risoluzione dei problemi. Negli ultimi anni, l'intelligenza artificiale ha beneficiato di computer sempre più potenti, dotati di una maggiore potenza di elaborazione nell'esecuzione di un'attività e di capacità più avanzate di apprendimento automatico, che è il modo in cui i computer acquisiscono le conoscenze necessarie per le applicazioni di intelligenza artificiale.

2. Apprendimento automatico

L'apprendimento automatico rappresenta un ramo dell'informatica che utilizza enormi quantità di dati per insegnare ai computer a eseguire particolari attività. L'apprendimento automatico prevede l'esame dei dati relativi a un'attività specifica, l'identificazione dei modelli all'interno di tali dati, la creazione di associazioni tra i modelli e, infine, l'uso delle informazioni apprese per modellare il modo in cui il computer svolge l'attività. Se, in seguito a tale analisi, l'esecuzione dell'attività da parte del computer migliora, significa che è avvenuto un apprendimento automatico.

Considerata la disponibilità di dati su praticamente ogni argomento immaginabile, l'apprendimento automatico viene utilizzato per migliorare le prestazioni dei computer in ogni ambito, dalle previsioni meteorologiche alla selezione automatica di titoli azionari, fino alla traduzione automatica.

3. Traduzione automatica

In poche parole, la traduzione automatica è la traduzione realizzata da una macchina: voi fornite materiale in una lingua di origine a un computer e quest'ultimo ve lo restituisce in un'altra lingua. Anche se non è perfetto, si tratta di uno degli strumenti più potenti oggi disponibili per produrre traduzioni di alta qualità in modo più efficiente.

Negli ultimi decenni la traduzione automatica ha fatto progressi enormi, sia nella qualità del risultato finale che nel numero di lingue supportate. Dai semplici sistemi di sostituzione delle singole parole agli albori della traduzione automatica, passando per la codifica di grammatica e dizionari della traduzione automatica basata su regole, la traduzione automatica statistica basata su paradigmi numerici, l'apprendimento profondo e le reti neurali della traduzione automatica neurale, fino all'output straordinariamente simile a quello umano dell'intelligenza artificiale generativa, gli sviluppi in quest'ambito riflettono l'uso sempre più sofisticato dei computer.

Ologramma futuristico che rappresenta la traduzione automatica

4. Traduzione automatica statistica

La traduzione automatica statistica (SMT, Statistical Machine Translation) utilizza l'apprendimento automatico per generare un numero elevato di traduzioni possibili per una determinata frase di origine, quindi seleziona l'opzione migliore in base alle probabilità che determinate parole e frasi vengano utilizzate insieme nella lingua di destinazione. La traduzione automatica statistica prevede l'apprendimento della traduzione tramite "n-grammi", ovvero piccoli gruppi di parole utilizzate insieme nella lingua di origine e in quella di destinazione. Durante le fasi di apprendimento automatico, nel sistema di traduzione automatica statistica vengono inseriti materiali di addestramento, ovvero numerosi esempi di frasi nella lingua di origine con le relative traduzioni nella lingua di destinazione. L'algoritmo di apprendimento divide le frasi di origine e di destinazione in n-grammi. Poi determina quali n-grammi nella lingua di destinazione hanno maggiore probabilità di apparire in una traduzione se in una frase sono presenti determinati n-grammi nella lingua di origine.

A quel punto, l'algoritmo di apprendimento crea un modello linguistico che calcola la probabilità che determinate parole o frasi siano presenti una accanto all'altra nella lingua di destinazione. Una volta completato l'apprendimento, quando è il momento di tradurre nuovo materiale, il sistema di traduzione automatica statistica suddivide la nuova frase di origine in n-grammi, trova gli n-grammi di destinazione associati più di frequente e genera le possibili traduzioni. Il risultato finale è costituito dalla frase i cui n-grammi nella lingua di destinazione sono maggiormente correlati agli n-grammi della frase di origine e le cui parole nella lingua di destinazione hanno maggiore probabilità di essere utilizzate insieme.

La traduzione automatica statistica fornisce risultati sorprendentemente buoni, in particolare se si considera che un sistema di questo tipo non ha niente di linguistico, ma si limita a considerare gli n-grammi e mai un'intera frase. Questo approccio è diverso da quello adottato per un tipo alternativo di traduzione automatica: la traduzione automatica neurale.

5. Traduzione automatica neurale

La traduzione automatica neurale (NMT, Neural Machine Translation) colma la lacuna più grande della traduzione automatica statistica: l'uso esclusivo dell'analisi di n-grammi. Anche con la traduzione automatica neurale il sistema riceve il materiale di addestramento, ma c'è una differenza fondamentale. Dopo aver ricevuto il materiale, il sistema determina autonomamente come apprendere quanto più possibile dai dati.

I sistemi di traduzione automatica neurale creano vettori di informazioni per ogni frase di origine, associando le informazioni su ogni parola con quelle delle parole che la circondano. Alcuni sistemi sviluppano centinaia di informazioni per ogni singola parola, producendo risultati estremamente accurati. Attraverso l'apprendimento profondo, i sistemi di traduzione automatica neurale acquisiscono una quantità incredibile di informazioni su ogni parola e frase di origine, dopodiché utilizzano il cosiddetto modello di attenzione per concentrarsi sulle caratteristiche chiave apprese, analizzando voluminosi flussi di dati importanti per il processo di traduzione. Il risultato è una traduzione generata dal computer che appare molto più scorrevole e che ha iniziato a suonare sempre più naturale.

La traduzione automatica neurale (NMT) ha rivoluzionato il nostro settore. Man mano che sono stati apportati miglioramenti alla tecnologia e che gli strumenti sono diventati più avanzati, abbiamo utilizzato la traduzione automatica in misura sempre maggiore per accelerare i processi di traduzione. Nel 2022, i principali motori di traduzione automatica neurale non hanno presentato miglioramenti sostanziali nella qualità, segnalando così l'imminente fine del paradigma e creando condizioni propizie per un cambiamento radicale.

6. Intelligenza artificiale generativa e Large Language Model

L'intelligenza artificiale generativa è un sistema di intelligenza artificiale in grado di generare nuovi contenuti, inclusi testo e immagini, in base ai prompt e a un addestramento multimodale completo. La sua capacità di produrre output con una qualità simile a quella umana è notevole. Un Large Language Model è un sistema di intelligenza artificiale incentrato sulle lingue. È in grado di riassumere, tradurre, prevedere e generare testo in base alle conoscenze acquisite da enormi database. Anche se non ha ricevuto un addestramento specifico per la traduzione di testi, può svolgere questa attività con un buon (seppur non eccellente) livello qualitativo e sta migliorando rapidamente. ChatGPT è stato il primo LLM a conoscere un'ampia diffusione. A soli due mesi dal lancio, avvenuto nel novembre 2022, aveva già raggiunto 100 milioni di utenti.

Man mano che le loro capacità aumentano, GenAI e LLM consentiranno di gestire un numero sempre maggiore di attività linguistiche ripetitive. Ci aspettiamo che queste tecnologie creino più spazio per attività umane di maggior valore nelle aree seguenti.

Ideazione dei contenuti: le persone avviano il processo di creazione dei contenuti con l'ideazione.
Convalida dei contenuti: le persone garantiscono accuratezza, sicurezza e autenticità.
Analisi dei contenuti: le persone svolgono un monitoraggio più rigoroso e migliorano le prestazioni.

Servizi di maggior valore come la transcreazione diventeranno economicamente più accessibili per le aziende, consentendo ai brand di offrire contenuti più interessanti, convincenti e affidabili per acquirenti di diversi paesi. Lionbridge sta identificando i casi d'uso dell'intelligenza artificiale generativa e sviluppando applicazioni in grado di sfruttare al massimo le capacità degli LLM per automatizzare il flusso di lavoro di localizzazione.

7. Traduzione automatica tramite Large Language Model

La traduzione automatica tramite Large Language Model si riferisce all'uso degli LLM per la traduzione automatica. Questo tipo di traduzione potrebbe un giorno sostituire il paradigma della traduzione automatica neurale, ma attualmente la tecnologia non è ancora matura. Gli LLM producono un output discreto e addirittura il modello GPT-4 di OpenAI ha superato il motore di traduzione automatica neurale Yandex nella combinazione linguistica inglese-cinese in una valutazione di Lionbridge. Tuttavia, al momento della stesura di questo articolo, gli LLM non possono competere in velocità, qualità e convenienza con i cinque principali motori di traduzione automatica neurale, pertanto non rappresentano una valida sostituzione. Lionbridge monitora le prestazioni della traduzione automatica tramite LLM con lo strumento di valutazione della traduzione automatica Lionbridge. Questo strumento attualmente misura le prestazioni di diversi modelli LLM, tra cui la traduzione automatica di GPT-4.

8. Traduzione con intervento umano

La traduzione automatica con intervento umano si riferisce agli sforzi congiunti di esseri umani e macchine per produrre i risultati di traduzione di cui avete bisogno.

Anche se GenAI e LLM consentono un processo di traduzione più efficiente e conveniente, il contributo umano è indispensabile per i seguenti motivi:

La tecnologia non può sostituire l'ingegno umano.
Non è possibile avere totale fiducia nella tecnologia senza supervisione.
La tecnologia non è in grado di funzionare in modo indipendente.

Ecco in che modo l'intervento umano può aiutare a superare alcuni importanti problemi degli LLM e ad aggiungere valore:

Revisione dell'output tradotto nella sua interezza, particolarmente importante per la coerenza. GenAI e LLM funzionano meglio quando l'input è limitato a poche centinaia di parole, ma questo vincolo porta spesso alla creazione di frammenti di traduzione non coerenti.
Inserimento di differenti glossari e istruzioni in base al tipo di progetto in una serie di prompt per ottenere una voce del brand coerente.
Generazione di prompt come passaggio iniziale che non può essere eseguito dalla tecnologia e requisito fondamentale per ottenere buone prestazioni da GenAI e LLM.
Creazione di piattaforme sofisticate e dedicate che organizzano migliaia di prompt, ne consentono il riciclo e inseriscono istruzioni e glossari in base alle esigenze per ottenere i risultati desiderati. Lionbridge ha progettato e lanciato una piattaforma di iterazione dei prompt per riciclare e utilizzare in modo iterativo i prompt efficaci.
Determinazione dei modi in cui integrare la tecnologia LLM nei flussi di lavoro esistenti che sfruttano una combinazione di memorie di traduzione e traduzione automatica neurale per risparmiare tempo, ridurre il lavoro e tagliare i costi. Il team di Lionbridge dedicato all'intelligenza artificiale eccelle nell'armonizzare gli LLM nei flussi di lavoro esistenti.

Perché Lionbridge

Lionbridge conosce a fondo il mondo della traduzione automatica. Offriamo servizi di traduzione automatica su larga scala dal 2002 e siamo all'avanguardia negli ultimi entusiasmanti sviluppi. Visitate la nostra pagina dedicata alla traduzione automatica per scoprire le ultime tendenze in questo settore.

Contattateci

Volete implementare gli strumenti più recenti per automatizzare le traduzioni? Contattateci oggi stesso per saperne di più.

#blog_posts
#translation_localization

A CURA DI

Lionbridge

Compilate il modulo di contatto per parlare con i nostri consulenti.

Saremo felici di analizzare le vostre esigenze e mostrarvi come le nostre soluzioni innovative possono aiutarvi a superare ogni confine ed espandere la vostra portata globale. Siete pronti per scoprire tutte le possibilità? Siamo qui per aiutarvi.

SERVIZI OFFERTI

SETTORI

RISORSE

CHI SIAMO