LINGUA:
LINGUA:
Hub di conoscenze Lionbridge
- Risultati positivi per i pazienti
- Il futuro della localizzazione
- Dall'innovazione all'immunità
Servizi per i contenuti
- Redazione di contenuti tecnici
- Formazione e eLearning
- Resoconti finanziari
- Marketing digitale
- SEO e ottimizzazione dei contenuti
Servizi di traduzione
- Localizzazione di video
- Localizzazione di software
- Traduzione di contenuti regolamentati
- Interpretariato
- Eventi live
- Marketing e SEO multilingue
- Localizzazione di siti web
Servizi di testing
- Test e controlli funzionali
- Test di compatibilità
- Test di interoperabilità
- Test delle prestazioni
- Test di accessibilità
- UX/CX Testing
Soluzioni
- Modelli di servizio per la traduzione
- Traduzione automatica
- Smart Onboarding™
- Aurora AI Studio™
I nostri hub di conoscenze
- Risultati positivi per i pazienti
- Il futuro della localizzazione
- Dall'innovazione all'immunità
- Centro risorse per il COVID-19
- La serie della crisi
- Interazione con i pazienti
- Approfondimenti Lionbridge
Life Science
- Settore farmaceutico
- Ricerca clinica
- Normative
- Post-approvazione
- Aziende
- Dispositivi medicali
- Convalida e contenuti clinici
- Normative
- Post-approvazione
- Aziende
Settore bancario e finanziario
Distribuzione
Lusso
E-commerce
Lionbridge Games
Settore automobilistico
Beni di consumo confezionati
Tecnologia
Produzione industriale
Servizi per il settore legale
Viaggi e turismo
SELEZIONARE LA LINGUA:
Da tempo affermiamo che il paradigma della traduzione automatica (MT) è pronto per un cambiamento radicale. Leggete i commenti dei nostri esperti per scoprirne i motivi.
I nostri esperti in traduzione automatica forniscono informazioni utili su numerosi argomenti, tra cui:
Meglio comprendete la traduzione automatica e l'intelligenza artificiale generativa, più riuscirete a utilizzare questi strumenti in modo selettivo per soddisfare le vostre esigenze. Sfruttate i punti di forza offerti da ciascun paradigma per ottenere una maggiore efficienza nella traduzione, un aumento della produzione di contenuti e risparmi sui costi.
Considerando la diffusione e le promesse dell'intelligenza artificiale generativa (GenAI) e dei Large Language Model (LLM), abbiamo migliorato il report di valutazione della qualità della traduzione automatica di Lionbridge. Da ora in avanti, il report includerà i risultati di traduzione di GPT-4, oltre a quelli di GPT-3.5 e Davinci, e, naturalmente, le prestazioni dei motori di traduzione neurale (NMT).
Abbiamo esaminato diversi problemi di GPT-4, tra cui le prestazioni lente, l'incapacità di fornire traduzioni per varie ragioni e comportamenti non coerenti, come la mancata produzione di traduzioni in alcune esecuzioni ma non in altre.
GPT-4 non ha tradotto una frase specifica nel nostro set di test per la traduzione automatica.
Dopo una ricerca, abbiamo determinato che il problema era causato da un termine che in contesti specifici può avere una connotazione sessuale. La frase nel nostro set di test era in realtà del tutto standard e accettabile. Tuttavia, il termine ha comunque causato l'attivazione del filtro del contenuto sessuale di GPT-4 e l'intelligenza artificiale di conseguenza ha censurato la traduzione della frase e non ha prodotto alcun risultato. Siamo rimasti sorpresi da questo risultato per due motivi:
L'uso tipico del termine isolato non comportava alcun problema.
Il contesto della frase specifica non aveva interpretazioni problematiche.
Abbiamo concluso che probabilmente una parte del meccanismo di filtro di GPT-4 si basa su un semplice elenco di parole proibite che include anche i termini ambigui. Questo approccio è problematico poiché può comportare l'attivazione eccessiva del meccanismo di filtro e la generazione di falsi positivi, causando gravi problemi per la traduzione professionale.
Poiché le tecnologie di traduzione automatica precedenti, come i motori di traduzione automatica neurale, non presentano questo tipo di problema di filtro dei contenuti, possiamo concludere che questa sia una limitazione della tecnologia LLM.
Questa limitazione ha alcune implicazioni in scenari reali. Immaginiamo, ad esempio, di dover tradurre contenuti medici legati alla ginecologia o all'educazione sessuale. La tecnologia LLM potrebbe non tradurre alcune parti del testo.
È interessante notare che questo problema si è verificato solo traducendo la frase specifica in una determinata lingua, ovvero il cinese, ma non in caso di traduzione in altre lingue. Ciò indica che il filtro viene applicato all'output di GPT-4. La soluzione consiste nel disattivare i filtri del contenuto per le attività di traduzione.
Dopo cinque settimane di monitoraggio, abbiamo riscontrato un'elevata variabilità nell'output della traduzione automatica tramite LLM, in particolare con GPT-4.
Sebbene ci aspettassimo questo risultato per l'intelligenza artificiale generativa, la variabilità è stata maggiore di quanto previsto, anche usando l'impostazione dei parametri Temperature e Top Probability (Top_p) in modo da ridurre la creatività e rendere l'output più deterministico. L'output della traduzione è stato diverso in ogni esecuzione di GPT, anche eseguendo le traduzioni una di seguito all'altra.
Le traduzioni, anche se diverse, erano entrambe accettabili. Questo rappresenta tuttavia un altro aspetto da tenere sotto controllo e che differenzia questa tecnologia dal paradigma precedente della traduzione automatica neurale.
Stiamo iniziando a pensare che questo potenziale cambiamento di paradigma, dalla traduzione automatica neurale a quella basata su LLM, potrebbe non rappresentare solo un cambiamento tecnologico, ma richiedere anche un cambiamento di mentalità: potremmo doverci preparare a convivere con output meno deterministici, anche quando usiamo gli stessi input e gli stessi parametri, e aspettarci una maggiore variabilità rispetto a quanto siamo abituati a ottenere con l'automazione attuale.
Pur dovendo convivere con un certo grado di incertezza, potrebbe essere possibile usare alcuni meccanismi e best practice per rendere la variabilità controllabile, almeno in parte.
Osservando il nostro grafico tenete inoltre presente che la diminuzione della distanza di edit per GPT-4 non indica una diminuzione della qualità. Si tratta semplicemente di un riflesso della variabilità degli output di GPT. Il mese prossimo, potremmo vedere la linea salire. Continuate a seguirci per scoprire gli sviluppi futuri e per altri approfondimenti.
—Rafa Moral, Lionbridge Vice President, Innovation
Leggete gli executive summary di seguito per scoprire gli argomenti trattati in passato dagli esperti.
Marzo 2023 — Un modello LLM (Large Language Model) supera un motore di traduzione automatica neurale: cosa ci riserva il futuro?
Febbraio 2023 — Miglioramento della traduzione automatica: personalizzazione e addestramento della traduzione automatica
Gennaio 2023 — Confronto della qualità della traduzione tra ChatGPT e i principali motori di traduzione automatica
Novembre 2022 — Miglioramento della traduzione automatica Microsoft
Ottobre 2022 — Traduzione automatica e formalità del linguaggio
Settembre 2022 — Uso della terminologia per migliorare la qualità della traduzione automatica
Agosto 2022 — Evitare gli errori catastrofici durante la traduzione automatica
Luglio 2022 — Classifica delle lingue per la traduzione automatica
Giugno 2022 — Analisi accurata della qualità della traduzione automatica
Maggio 2022 — Prestazioni di Amazon e Yandex nel mese di maggio
Aprile 2022 — Prestazioni di Yandex in aprile
Marzo 2022 — Valutazioni comparative personalizzate della traduzione automatica
Febbraio 2022 — Il futuro della traduzione automatica neurale (NMT)
Gennaio 2022 — Prestazioni dei motori di traduzione automatica a gennaio
Dicembre 2021 — Lionbridge aggiunge la traduzione automatica di Yandex allo strumento comparativo di valutazione della qualità della traduzione automatica.
Novembre 2021 — Bing Translator apporta alcuni miglioramenti
Ottobre 2021 — Progressi del motore di traduzione automatica di Amazon
Settembre 2021 — Amazon apporta alcuni miglioramenti alla qualità della traduzione automatica
Agosto 2021 — Principali aziende tecnologiche e sviluppo dei rispettivi motori di traduzione automatica
Ottenete utili informazioni dai nostri esperti in traduzione automatica.
L'intelligenza artificiale generativa ha raggiunto un importante traguardo: ha superato un motore di traduzione automatica neurale in una delle nostre valutazioni comparative. Nello specifico, il Large Language Model (LLM) GPT-4 ha fornito una qualità leggermente migliore rispetto a Yandex per la combinazione linguistica dall'inglese al cinese, come illustrato nella Figura 1.
Questo risultato è degno di nota perché è la prima volta dal suo avvento che la traduzione automatica neurale viene superata da un diverso tipo di approccio alla traduzione automatica. Inoltre, un approccio "non MT", ossia un'automazione linguistica polifunzionale non preparata specificamente per la traduzione automatica, ha battuto un motore di traduzione automatica neurale.
Perché si tratta di un evento importante? Se siete fornitori di servizi di traduzione automatica, dovete essere in prima linea nel cambiamento tecnologico e valutarne l'impatto sulla vostra attuale soluzione di traduzione automatica per rimanere competitivi. Se siete acquirenti di servizi di traduzione automatica, dovete essere al corrente di questi sviluppi per fare investimenti oculati che probabilmente includeranno alcune tecnologie basate sui modelli LLM al posto di soluzioni di traduzione automatica neurale pura.
È importante sottolineare che l'intelligenza artificiale generativa è ancora nelle fasi iniziali, pertanto risulta inferiore alle aspettative in alcune aree chiave. Produce ad esempio output variabili in caso di esecuzioni multiple, ha un'API (Application Programming Interface) instabile e commette più errori rispetto ai motori di traduzione automatica neurale. Questi problemi dovranno essere risolti per permettere alla tecnologia di diventare più matura e stiamo già assistendo ad alcuni miglioramenti che avvengono a una velocità straordinaria.
L'incredibile velocità con cui i modelli LLM sono in grado di migliorare supporta l'idea che saranno probabilmente destinati a diventare il prossimo paradigma per la traduzione automatica. Con l'evoluzione del paradigma, ci aspettiamo un periodo ibrido in cui i fornitori di servizi di traduzione automatica neurale integreranno alcuni aspetti dei modelli LLM nell'architettura di traduzione automatica neurale.
Leggete il nostro blog per un confronto della qualità di traduzione tra la traduzione automatica neurale e i modelli LLM per altre due combinazioni linguistiche e per ulteriori considerazioni sul fatto che stiamo assistendo all'inizio della fine del paradigma di traduzione automatica neurale.
—Rafa Moral, Lionbridge Vice President, Innovation
I motori di traduzione automatica (MT) generici forniscono spesso un output adeguato per le aziende che desiderano automatizzare le proprie traduzioni. Tuttavia, questi motori possono produrre suggerimenti mediocri, in particolare in caso di testi con contenuti tecnologici o altamente specializzati.
Le aziende che vogliono migliorare i risultati della traduzione automatica per raggiungere obiettivi specifici possono prendere in considerazione due opzioni: la personalizzazione e/o l'addestramento della traduzione automatica. Ognuno di questi metodi, o una combinazione di entrambi, può produrre risultati migliori durante il processo di traduzione automatica.
I due approcci presentano tuttavia alcune differenze e non sono intercambiabili. La tabella 1 fornisce una panoramica della personalizzazione e dell'addestramento della traduzione automatica e presenta alcune considerazioni per la valutazione di ciascun metodo.
Personalizzazione della traduzione automatica | |
---|---|
Che cos'è e come funziona | Adattamento di un motore di traduzione automatica preesistente con un glossario e un elenco di termini da non tradurre (DNT) per migliorare la precisione delle traduzioni generate automaticamente |
Cosa fa | Migliora i suggerimenti della traduzione automatica per un output più preciso e riduce la necessità di post-editing |
Vantaggi specifici | Consente alle aziende di mantenere coerente l'identità e la terminologia del brand e di applicare varianti in base all'area geografica |
Rischi legati all'uso | Se gestita in modo non appropriato, la traduzione automatica può produrre suggerimenti scadenti e avere un impatto negativo sulla qualità complessiva |
Quando si usa | Ideale per contenuti tecnologici e orientati ai dettagli, nonché contenuti che richiedono: *Traduzioni accurate della terminologia *Varianti regionali quando i dati non sono sufficienti per l'addestramento |
Fattori di successo | Un professionista esperto nella traduzione automatica in grado di gestire correttamente le regole di normalizzazione di input e output, i glossari e gli elenchi di termini da non tradurre |
Considerazioni sui costi | Sono previsti un costo una tantum per aggiornare il profilo da inserire nel motore di traduzione automatica e alcuni costi periodici per la gestione del glossario nel tempo; la soluzione è piuttosto economica se si tiene conto dei benefici e i costi sono in genere inferiori rispetto a quelli associati all'addestramento della traduzione automatica |
Tabella 1. Confronto tra personalizzazione e addestramento della traduzione automatica
Addestramento della traduzione automatica | |
---|---|
Che cos'è e come funziona | Processo che prevede la creazione e l'addestramento di un motore di traduzione automatica tramite l'impiego di grossi volumi di dati bilingue provenienti da corpora e memorie di traduzione per migliorare la precisione delle traduzioni generate automaticamente |
Cosa fa | Migliora i suggerimenti della traduzione automatica per un output più preciso e riduce la necessità di post-editing |
Vantaggi specifici | Consente alle aziende di applicare un'identità, un tono e uno stile specifici del brand, nonché varianti in base all'area geografica |
Rischi legati all'uso | L'addestramento della traduzione automatica potrebbe non avere alcun impatto sull'output se c'è un volume insufficiente di dati di qualità, mentre potrebbe produrre suggerimenti scadenti e avere un impatto negativo sulla qualità complessiva se autori inesperti usano la terminologia in modo non appropriato |
Quando si usa | Ideale per contenuti altamente specializzati, di marketing e creativi, nonché contenuti che richiedono: *Identità, tono o stile del brand specifico *Varianti regionali quando i dati sono sufficienti per l'addestramento |
Fattori di successo | Almeno 15.000 segmenti univoci per addestrare adeguatamente il motore |
Considerazioni sui costi | Sono previsti costi associati al primo processo di addestramento e costi potenziali per gli interventi successivi, che possono rendersi necessari nel tempo se il monitoraggio delle prestazioni della traduzione automatica indica margini di miglioramento; in determinati casi, l'investimento risulta vantaggioso se si considerano i potenziali benefici |
Tabella 1. Confronto tra personalizzazione e addestramento della traduzione automatica
Personalizzazione della traduzione automatica | Addestramento della traduzione automatica | |
---|---|---|
Che cos'è e come funziona | Adattamento di un motore di traduzione automatica preesistente con un glossario e un elenco di termini da non tradurre (DNT) per migliorare la precisione delle traduzioni generate automaticamente | Processo che prevede la creazione e l'addestramento di un motore di traduzione automatica tramite l'impiego di grossi volumi di dati bilingue provenienti da corpora e memorie di traduzione per migliorare la precisione delle traduzioni generate automaticamente |
Cosa fa | Migliora i suggerimenti della traduzione automatica per un output più preciso e riduce la necessità di post-editing | Migliora i suggerimenti della traduzione automatica per un output più preciso e riduce la necessità di post-editing |
Vantaggi specifici | Consente alle aziende di mantenere coerente l'identità e la terminologia del brand e di applicare varianti in base all'area geografica | Consente alle aziende di applicare un'identità, un tono e uno stile specifici del brand, nonché varianti in base all'area geografica |
Rischi legati all'uso | Se gestita in modo non appropriato, la traduzione automatica può produrre suggerimenti scadenti e avere un impatto negativo sulla qualità complessiva | L'addestramento della traduzione automatica potrebbe non avere alcun impatto sull'output se c'è un volume insufficiente di dati di qualità, mentre potrebbe produrre suggerimenti scadenti e avere un impatto negativo sulla qualità complessiva se autori inesperti usano la terminologia in modo non appropriato |
Quando si usa | Ideale per contenuti tecnologici e orientati ai dettagli, nonché contenuti che richiedono: *Traduzioni accurate della terminologia *Varianti regionali quando i dati non sono sufficienti per l'addestramento |
Ideale per contenuti altamente specializzati, di marketing e creativi, nonché contenuti che richiedono: *Identità, tono o stile del brand specifico *Varianti regionali quando i dati sono sufficienti per l'addestramento |
Fattori di successo | Un professionista esperto nella traduzione automatica in grado di gestire correttamente le regole di normalizzazione di input e output, i glossari e gli elenchi di termini da non tradurre | Almeno 15.000 segmenti univoci per addestrare adeguatamente il motore |
Considerazioni sui costi | Sono previsti un costo una tantum per aggiornare il profilo da inserire nel motore di traduzione automatica e alcuni costi periodici per la gestione del glossario nel tempo; la soluzione è piuttosto economica se si tiene conto dei benefici e i costi sono in genere inferiori rispetto a quelli associati all'addestramento della traduzione automatica | Sono previsti costi associati al primo processo di addestramento e costi potenziali per gli interventi successivi, che possono rendersi necessari nel tempo se il monitoraggio delle prestazioni della traduzione automatica indica margini di miglioramento; in determinati casi, l'investimento risulta vantaggioso se si considerano i potenziali benefici |
Tabella 1. Confronto tra personalizzazione e addestramento della traduzione automatica
Leggete il nostro blog per altre informazioni sul confronto tra personalizzazione e addestramento della traduzione automatica.
—Thomas McCarthy, Lionbridge MT Business Analyst
I modelli linguistici di grandi dimensioni (LLM, Large Language Model) possono essere una buona alternativa al paradigma della traduzione automatica neurale (NMT) per la traduzione automatica (MT)? Per scoprirlo, abbiamo confrontato le prestazioni di traduzione di ChatGPT, l'ultima versione di OpenAI della famiglia di modelli LLM GPT-3, con i cinque principali motori di traduzione automatica che usiamo nel nostro strumento comparativo di valutazione della qualità della traduzione automatica.
Come previsto, i motori di traduzione automatica neurale specializzati traducono meglio di ChatGPT. Ma, sorprendentemente, ChatGPT fa un lavoro considerevole. Come illustrato nella Figura 1, ChatGPT ha raggiunto prestazioni quasi al livello dei motori specializzati.
Abbiamo calcolato il livello di qualità in base alla distanza di edit inversa, usando più riferimenti per la combinazione linguistica inglese-spagnolo. La distanza di edit misura il numero di modifiche che un essere umano deve apportare all'output della traduzione automatica affinché la traduzione risultante raggiunga lo stesso livello della traduzione umana. Per il nostro calcolo, abbiamo confrontato l'output non elaborato della traduzione automatica con 10 diverse traduzioni umane (riferimenti multipli) anziché una sola. Nel calcolo della distanza di edit inversa, maggiore è il numero risultante, migliore è la qualità.
Figura 1. Confronto della qualità della traduzione automatica tra ChatGPT e i principali motori di traduzione automatica in base alla distanza di edit inversa, usando più riferimenti per la combinazione linguistica inglese-spagnolo.
Questi risultati sono notevoli perché il modello generico è stato addestrato per svolgere attività di elaborazione del linguaggio naturale (NLP) e non in modo specifico per eseguire traduzioni. Le prestazioni di ChatGPT hanno un livello di qualità simile a quello prodotto dai motori di traduzione automatica due o tre anni fa.
Considerando l'evoluzione dei modelli LLM, grazie all'attenzione del pubblico e ai significativi investimenti che le aziende tecnologiche stanno facendo in questa tecnologia, vedremo presto se ChatGPT supererà i motori di traduzione automatica o se la traduzione automatica inizierà ad adottare un nuovo paradigma LLM. La traduzione automatica può usare i modelli LLM come base, ma quindi la tecnologia viene perfezionata in modo specifico per la traduzione. Si tratta di qualcosa di analogo a ciò che OpenAI e altre società che si occupano di modelli LLM stanno facendo per migliorare i loro modelli generici per casi d'uso specifici, come consentire alle macchine di comunicare con gli esseri umani in modo colloquiale. La specializzazione aggiunge precisione alle attività svolte.
Un aspetto straordinario di questi modelli linguistici di grandi dimensioni "generici" è la loro capacità di fare molte cose diverse e offrire una qualità eccellente nella maggior parte delle attività svolte. Ad esempio, GATO di DeepMind, un altro modello di intelligenza generale, è stato testato con più di 600 attività, con risultati straordinari in 400 casi.
Continueranno ad esistere due linee di sviluppo: i modelli generici, come GPT, Megatron e GATO, e i modelli specializzati per scopi specifici basati su tali modelli generici. I modelli generici sono importanti per far progredire l'intelligenza artificiale generica (AGI, Artificial Generic Intelligence) per consentire sviluppi ancora più sorprendenti a lungo termine. I modelli specializzati avranno applicazioni pratiche nel breve periodo per aree specifiche. Uno degli aspetti notevoli dei modelli LLM è che entrambe le linee possono progredire e funzionare in parallelo.
Siamo curiosi di scoprire cosa ci riserva il futuro. Continueremo a valutare i modelli LLM e pubblicheremo i risultati in modo da tenervi aggiornati su questa entusiasmante evoluzione. Leggete i nostri blog per comprendere più a fondo le prestazioni di ChatGPT nella traduzione e per saperne di più su ChatGTP e la localizzazione e sui motivi per cui si candida a rivoluzionare questo settore.
—Rafa Moral, Lionbridge Vice President, Innovation
Complessivamente, nel periodo tra l'11 ottobre e l'1 novembre abbiamo riscontrato un notevole miglioramento nei risultati della traduzione automatica (MT) di Microsoft. Considerando questo recente miglioramento della qualità di Bing Translator, i principali motori di traduzione automatica producono risultati molto simili. Assistiamo quindi a una battaglia serrata per la posizione di leadership.
I principali motori di traduzione automatica non hanno mostrato miglioramenti interessanti per mesi. Ci auguriamo che questa svolta di Microsoft interrompa questa tendenza e segni l'inizio di nuovi progressi.
Siamo andati oltre la nostra consueta misurazione delle traduzioni rispetto a un singolo riferimento e abbiamo confermato il miglioramento di Microsoft con una seconda fase di monitoraggio svolta usando più riferimenti. In questo processo di valutazione della traduzione automatica abbiamo usato 10 traduzioni di riferimento svolte da traduttori umani (lo standard di riferimento) invece di un'unica traduzione, al fine di ottenere una metrica più precisa per la distanza di edit, considerando più possibili traduzioni corrette nei risultati finali.
Con l'avvicinarsi della fine dell'anno, notiamo che nel 2022 l'andamento dei risultati per la traduzione automatica è stato piuttosto piatto. Abbiamo osservato pochi cambiamenti e questo sviluppo nella traduzione automatica di Microsoft Bing potrebbe rappresentare il progresso più notevole dell'intero anno. Come già abbiamo commentato nella prima parte dell'anno, l'attuale paradigma di traduzione automatica potrebbe aver raggiunto un plateau. Non vediamo l'ora di scoprire cosa ci riserva il 2023 in ambito di traduzione automatica.
—Rafa Moral, Lionbridge Vice President, Innovation
Questo mese vogliamo spostare l'attenzione sul livello di formalità del linguaggio e su quanto sia difficile, ma non impossibile, ottenere buoni risultati quando si usa la traduzione automatica (MT).
I motori di traduzione automatica (MT) possono produrre risultati errati e incoerenti per quanto riguarda la formalità. Perché? I modelli di traduzione automatica in genere restituiscono una singola traduzione per ogni segmento di input. Quando il segmento di input è ambiguo, il modello deve scegliere una traduzione tra diverse opzioni valide, indipendentemente dal pubblico di destinazione. Questa scelta può portare a traduzioni incoerenti o con un livello di formalità non corretto.
È particolarmente difficile ottenere l'output corretto quando la lingua di origine ha meno livelli di formalità rispetto a quella di destinazione. Lingue come l'italiano hanno ad esempio modi formali ben definiti (tu, lei, voi), mentre l'inglese no.
Sebbene la maggior parte dei sistemi di traduzione automatica non supporti la formalità del linguaggio o i parametri di genere, stiamo assistendo ad alcuni progressi. Al momento, DeepL (API) e Amazon (console e SDK) offrono funzionalità per il controllo della formalità. Smart MT™ di Lionbridge, una soluzione di traduzione automatica di livello aziendale, consente l'applicazione di regole linguistiche al testo di destinazione al fine di produrre traduzioni automatiche con lo stile o il livello di formalità desiderato.
È fondamentale tradurre il testo di origine in modo efficace per soddisfare le esigenze del pubblico di destinazione e a tale scopo è necessario che nell'output della traduzione automatica venga usato un linguaggio formale o informale in modo appropriato. Le traduzioni che risultano "spente" o, peggio ancora, brusche possono allontanare il vostro pubblico.
Leggete il nostro blog per saperne di più sulla traduzione automatica e sul linguaggio formale e informale.
—Yolanda Martin, Lionbridge MT Specialist
L'uso della traduzione automatica (MT) offre numerosi vantaggi, ma è necessario procedere con cautela. I motori di traduzione automatica generici possono produrre traduzioni errate e, soprattutto, possono causare risultati indesiderati dal punto di vista terminologico per domini specifici. L'impatto può essere particolarmente dannoso per settori come quelli medico e legale. Ci sono tuttavia alcuni accorgimenti che consentono di migliorare l'output della traduzione automatica.
L'uso della terminologia può consentire di migliorare la qualità della traduzione automatica e ottenere traduzioni accurate e coerenti.
È molto importante eseguire il training dei sistemi di traduzione automatica personalizzati con testi bilingue specifici del dominio che includano terminologia specializzata. Tuttavia, anche se si esegue il training con testi specializzati, non si può avere la sicurezza di ottenere traduzioni accurate se la terminologia non viene usata in modo coerente. La ricerca in quest'area propone di inserire le informazioni linguistiche nei sistemi di traduzione automatica neurale (NMT). L'implementazione manuale o semiautomatica delle annotazioni dipende dalle risorse disponibili, come i glossari, e dai vincoli, ad esempio in termini di tempo, costi e disponibilità di annotatori specializzati.
La soluzione Lionbridge Smart MT™ consente l'applicazione di regole linguistiche al testo di origine e di destinazione, nonché l'applicazione della terminologia in base a elenchi di termini da non tradurre (DNT) e glossari aggiunti a un profilo specifico. Aiutiamo i nostri clienti a creare e gestire i glossari, che vengono regolarmente perfezionati per includere termini nuovi e pertinenti ed eliminare la terminologia obsoleta. Dopo essere stati creati e inseriti in Smart MT, i glossari possono essere usati per tutti i motori di traduzione automatica, risparmiando tempo e denaro.
L'uso dei glossari per i progetti di traduzione automatica non è così semplice come potrebbe sembrare. I glossari, se usati in modo non appropriato, possono influire negativamente sulla qualità complessiva della traduzione automatica. Il modo migliore per applicare la terminologia corretta nella traduzione automatica è eseguire il training dei motori di traduzione. La combinazione di motori di traduzione automatica sottoposti a training, personalizzazione dei glossari e identificazione delle regole di pre-elaborazione e post-elaborazione consente di ottenere un output di traduzione automatica contenente la terminologia corretta e con uno stile simile a quello della documentazione del cliente.
Leggete il nostro blog per altre informazioni sull'uso della terminologia per migliorare l'output della traduzione automatica.
—Yolanda Martin, Lionbridge MT Specialist
Poiché le aziende si affidano sempre più spesso alla traduzione automatica (MT) come procedura standard, i dipendenti devono cercare di prevenire la diffusione di errori catastrofici.
Gli errori catastrofici sono più problematici degli errori di traduzione automatica standard, che riguardano una tipologia di errore correlata a caratteristiche linguistiche, come l'ortografia, la grammatica o la punteggiatura. Con errori catastrofici si intendono quegli errori che vanno oltre l'aspetto linguistico e si verificano quando l'output del motore di traduzione devia pericolosamente dal messaggio previsto. La errate informazioni o i malintesi che ne conseguono possono potenzialmente causare alle aziende problemi di reputazione, finanziari o legali e possono portare a conseguenze negative per la sicurezza pubblica o la salute. È essenziale trovare modi per identificare questi errori e impedire che compromettano le comunicazioni.
Lionbridge applica specifici controlli di qualità automatizzati nei testi tradotti per rilevare gli errori critici preservando la velocità della traduzione automatica e riducendo la necessità dell'intervento umano.
Questi metodi automatizzati consentono di rilevare:
Per proteggere maggiormente le aziende da errori catastrofici, è necessario che i professionisti informatici migliorino la tecnologia di traduzione automatica esistente per prevenire errori di questo tipo. Fino a quando ciò non avverrà, è possibile usare la tecnologia automatizzata per identificare i potenziali problemi, rivedere frasi problematiche e promuovere l'accuratezza durante il processo di traduzione.
Leggete il nostro blog per un esame più approfondito degli errori catastrofici provocati dalla traduzione automatica.
—Luis Javier Santiago, MT Group Leader,
e Rafa Moral, Lionbridge Vice President, Innovation
Google NMT, Bing NMT, Amazon, DeepL, Yandex: quale motore è il migliore? I dati del mese scorso, e l'attuale tendenza generale, mostrano che i principali motori offrono prestazioni simili. Ecco perché vale la pena considerare fattori aggiuntivi quando si sviluppa la strategia di traduzione automatica, ad esempio la facilità con cui i motori di traduzione automatica traducono combinazioni linguistiche specifiche.
Identificando le problematiche che i motori riscontrano nella gestione di combinazioni linguistiche specifiche, potrete allocare il budget in modo ottimale quando pianificate i costi di traduzione per diverse lingue. Sarà ad esempio necessario un maggiore impegno per ottenere traduzioni di alta qualità per combinazioni linguistiche complesse. Comprendere la complessità della lingua può essere utile per prendere le decisioni aziendali.
Classificare le lingue in base alla traducibilità non è un processo semplice, tuttavia per la valutazione è possibile usare metriche diverse. La distanza di edit, ovvero il numero di modifiche apportate da uno specialista di post-editing per fare in modo che il testo finale abbia una qualità al livello della traduzione umana, può fornire informazioni sulla complessità e sulla traducibilità (tramite traduzione automatica) per ogni combinazione linguistica.
La maggior parte delle lingue romanze, come portoghese, spagnolo, francese e italiano, richiede meno modifiche per raggiungere alti livelli di qualità in caso di traduzione dall'inglese. Abbiamo identificato queste lingue di destinazione come le più facili da gestire automaticamente e quindi occupano i primi quattro posti nella classifica di traducibilità. L'ungherese e il finlandese, due lingue uraliche, sono lingue più complesse e nella classifica occupano il 27° e il 28° posto. L'estone, un'altra lingua della stessa famiglia, è tra le lingue più complesse. Questi risultati, basati su milioni di frasi elaborate da Lionbridge, sottolineano l'importanza delle famiglie linguistiche per la qualità della traduzione automatica.
Sebbene il confronto tra le lingue presenti dei limiti, la classifica può fornire alcuni spunti interessanti per gestire al meglio i progetti multilingue. Leggete il nostro blog per conoscere tutta la classifica delle lingue stilata da Lionbridge.
—Rafa Moral, Lionbridge Vice President, Innovation
A giugno abbiamo osservato un leggero miglioramento nelle traduzioni russe da parte del motore di traduzione automatica Yandex e un piccolo calo nei risultati di traduzione con Microsoft Bing. Questi cambiamenti sono degni di nota o si tratta di risultati trascurabili e senza significato? Per scoprirlo, abbiamo analizzato i risultati sotto un diverso punto di vista.
Invece di usare un unico standard di riferimento per misurare la distanza dalla traduzione automatica a una traduzione umana "perfetta", abbiamo usato più traduzioni di riferimento. Abbiamo confrontato ogni traduzione automatica con dieci traduzioni svolte da traduttori professionisti. Adottando questo approccio, le piccole fluttuazioni nella qualità della traduzione di Yandex e Microsoft Bing di giugno sono scomparse. Possiamo quindi concludere che non ci sono stati cambiamenti nella qualità della traduzione automatica. I risultati di giugno sono stabili.
A volte i dati e le relative rappresentazioni grafiche possono essere fuorvianti. Questo accade spesso quando ci sono piccole differenze tra misurazioni diverse. È buona norma usare più di un approccio per valutare i dati e interpretare i risultati in modo accurato.
Per i prossimi mesi prevediamo pochi cambiamenti nella qualità dei motori di traduzione automatica. Useremo questa sezione per fornire analisi e osservazioni generali in relazione alla traduzione automatica. Il mese prossimo faremo un confronto tra combinazioni linguistiche sottoposte a traduzione automatica. Valuteremo se è possibile usare i dati per classificare le lingue e le famiglie linguistiche in base alla complessità della traduzione automatica e determineremo se la traduzione automatica funziona meglio con alcune combinazioni linguistiche specifiche.
—Rafa Moral, Lionbridge Vice President, Innovation
Per i motori di traduzione automatica questo è stato principalmente un altro mese statico.
Abbiamo notato che Amazon ha apportato un miglioramento incrementale nella modalità di gestione della combinazione linguistica inglese-spagnolo, per la quale è ora il motore principale. Amazon ha anche fatto piccoli passi avanti nelle altre lingue, ma con miglioramenti più limitati rispetto alla combinazione inglese-spagnolo. Ipotizziamo che questi progressi siano dovuti ad alcune modifiche generiche alle impostazioni e che siano una conseguenza del lavoro svolto per la combinazione inglese-spagnolo. I miglioramenti sembrano influenzare la gestione di alcuni caratteri speciali e delle stringhe con espressioni di misura.
Per il secondo mese consecutivo, Yandex ha apportato piccoli miglioramenti. È interessante notare che questi miglioramenti riguardano anche lo spagnolo.
Come abbiamo osservato in precedenza, non ci sono stati cambiamenti significativi. Tutti i motori hanno prestazioni analoghe. Nei prossimi mesi analizzeremo alcune aree specifiche della traduzione automatica e forniremo osservazioni generali. Naturalmente, seguiremo anche i principali sviluppi.
—Rafa Moral, Lionbridge Vice President, Innovation
Dopo diversi mesi senza variazioni nelle prestazioni del motore di traduzione automatica, Yandex ha fatto alcuni progressi, in particolare per quanto riguarda il tedesco.
In un'analisi dettagliata, abbiamo riscontrato progressi nella gestione da parte dei motori Yandex di frasi con segni di punteggiatura, come punti interrogativi, punti esclamativi, parentesi e barre, e unità di misura. Questi sviluppi sono probabilmente dovuti ad alcune ottimizzazioni apportate alle impostazioni della traduzione automatica piuttosto che a miglioramenti nei modelli. Abbiamo tuttavia riscontrato anche un miglioramento nel monitoraggio dei termini rari, quindi i progressi di Yandex potrebbero anche essere legati ad alcuni perfezionamenti dei modelli o a un incremento delle attività di training dei dati.
Lo scorso anno in questo periodo diversi motori di traduzione automatica hanno mostrato alcuni miglioramenti che abbiamo trovato interessanti. Esiste un modello temporale associato a questi progressi? Quest'anno vedremo qualcosa di simile a quello che abbiamo osservato nel 2021? Stiamo monitorando le prestazioni della traduzione automatica di questi motori e vi riferiremo i risultati nel prossimo mese.
In generale, c'è un maggiore interesse per la valutazione dei motori di traduzione automatica. Oggi quasi tutti sono d'accordo sul fatto che la traduzione automatica sia una tecnologia matura. Le persone riconoscono l'utilità della tecnologia per quasi tutti i casi di traduzione, con o senza intervento umano e con approcci ibridi. Ma gli utenti dei servizi di traduzione automatica sono ancora alla ricerca del modo giusto per valutare, misurare e migliorare i risultati della traduzione automatica.
—Rafa Moral, Lionbridge Vice President, Innovation
Se avete seguito queste pagine, conoscete già le nostre valutazioni comparative generiche della traduzione automatica. Ogni mese identifichiamo quali motori di traduzione automatica funzionano meglio per determinate combinazioni linguistiche e monitoriamo i miglioramenti. A marzo, le prestazioni dei diversi motori di traduzione automatica sono rimaste stabili. È una tendenza che stiamo notando già da tempo. Come abbiamo commentato il mese scorso, ciò potrebbe indicare la necessità di un nuovo paradigma di traduzione automatica.
Sebbene condividiamo risultati generici, le aziende richiedono sempre più spesso valutazioni comparative personalizzate della traduzione automatica. A differenza delle valutazioni generiche, queste valutazioni prendono in considerazione le esigenze specifiche di un'azienda per determinare quali sono i motori di traduzione automatica più vantaggiosi.
Quando un'azienda vuole iniziare a usare la traduzione automatica oppure vuole migliorare il modo in cui la sta attualmente usando, è fondamentale identificare i motori di traduzione automatica che offrono le prestazioni migliori. Quando svolgiamo valutazioni personalizzate, adottiamo un approccio simile a quello illustrato in questa pagina, ma forniamo raccomandazioni basate sul tipo di contenuto e sui requisiti di combinazioni linguistiche di un'azienda.
Sebbene le valutazioni comparative personalizzate della traduzione automatica siano disponibili già da anni, oggi la domanda è aumentata. Riteniamo che questa tendenza sia dovuta al ruolo importante che la traduzione automatica svolge nell'aiutare le aziende a raggiungere il successo in un mercato digitale.
—Rafa Moral, Lionbridge Vice President, Innovation
Il motore di traduzione automatica di Google ha mostrato un piccolo miglioramento nei mesi di gennaio e febbraio 2022, mentre gli altri motori monitorati sono rimasti fermi. Queste osservazioni potrebbero portarci a farci alcune domande specifiche. La traduzione automatica neurale (NMT, Neural Machine Translation) sta raggiungendo un plateau? È necessario un nuovo cambio di paradigma considerando l'incapacità dei motori di fare progressi significativi? Abbiamo osservato tendenze simili quando la traduzione automatica neurale ha sostituito la traduzione automatica statistica.
Verso la fine dell'era della traduzione automatica statistica, non si riscontravano più miglioramenti nella qualità dell'output della traduzione automatica. I diversi motori di traduzione automatica avevano inoltre raggiunto livelli di qualità simili. Oggi riscontriamo tendenze analoghe. Anche se la traduzione automatica neurale potrebbe non venire sostituita nell'immediato, se crediamo nella crescita esponenziale e nella legge dei ritorni accelerati, e se consideriamo la corsa di trent'anni della traduzione automatica basata su regole, la prominenza decennale della traduzione automatica statistica e il fatto che la traduzione automatica neurale è ora al suo sesto anno, un nuovo cambio di paradigma potrebbe non essere troppo lontano.
—Rafa Moral, Lionbridge Vice President, Innovation
Durante il mese di gennaio, i principali motori di traduzione automatica (MT, Machine Translation) non hanno mostrato variazioni significative nelle prestazioni.
Google ha mostrato piccoli miglioramenti incrementali in alcuni domini e lingue. Le prestazioni della maggior parte degli altri motori sono rimaste costanti. Microsoft ha avuto alcuni miglioramenti negli ultimi mesi, ma le prestazioni si sono stabilizzate nel mese di gennaio. Nel complesso, la qualità di Google Translate continua a essere la migliore per quanto riguarda la tecnologia di traduzione automatica per utilizzo generico.
A dicembre abbiamo aggiunto un quinto motore di traduzione automatica al nostro strumento di valutazione. Monitorando Yandex, possiamo analizzare meglio la qualità della traduzione automatica per la lingua russa.
—Rafa Moral, Lionbridge Vice President, Innovation
A dicembre abbiamo aggiunto la traduzione automatica di Yandex al nostro strumento comparativo di valutazione della qualità della traduzione automatica.
In base ai nostri test, fino a questo momento Yandex:
Nel corso di altre osservazioni, MS Bing ha mostrato un miglioramento dell'output negli ultimi mesi del 2021. In particolare, sono migliorate le traduzioni in cinese. Anche Amazon ha fatto passi da gigante. Con l'inizio del nuovo anno, Google sta guadagnando posizioni e sta migliorando il suo output. In particolare, sono migliorate le traduzioni in spagnolo, russo e tedesco. Yandex non ha mostrato variazioni nelle prestazioni durante le cinque settimane in cui abbiamo eseguito il monitoraggio.
—Rafa Moral, Lionbridge Vice President, Innovation
Dopo alcune settimane di sperimentazioni e fluttuazioni nelle prestazioni, gli ingegneri Microsoft che si occupano di elaborazione del linguaggio naturale hanno chiaramente raggiunto nuovi risultati. Nelle ultime settimane Bing Translator ha mostrato miglioramenti in generale e in particolare per il cinese, che hanno reso questo motore di traduzione automatica il vincitore incontrastato del mese scorso. In Bing Translator sono stati colmati alcuni gap nella maggior parte delle aree, superando così le prestazioni di alcuni dei concorrenti. Bing Translator rimane uno dei motori più adatti per il training e i miglioramenti apportati lo rendono una scelta ideale per la creazione di modelli personalizzati per contenuti specifici.
—Jordi Macias, Lionbridge Vice President, Language Excellence
I motori di traduzione automatica di Amazon hanno continuato a evolversi in modo positivo durante il mese di ottobre, rafforzando i risultati del mese precedente. Queste ottimizzazioni continue rappresentano la seconda serie di miglioramenti incrementali apportati negli ultimi mesi.
Come promemoria, ecco alcune delle aree in cui i motori di traduzione automatica di Amazon hanno continuato a evolversi negli ultimi due mesi:
—Jordi Macias, Lionbridge Vice President, Language Excellence
Settembre si è rivelato un buon mese per i motori di traduzione automatica (MT) di Amazon. In primo luogo, l'azienda ha migliorato la qualità dell'output della traduzione automatica per il tedesco e il russo. Ci sono poi stati picchi per le combinazioni linguistiche di spagnolo e cinese. Queste ottimizzazioni rappresentano la seconda serie di miglioramenti incrementali apportati negli ultimi mesi.
Ecco alcune altre modifiche ai motori di traduzione automatica di Amazon:
—Yolanda Martin, Lionbridge MT Specialist
Tutte le grandi aziende tecnologiche hanno sviluppato i propri motori di traduzione automatica, incluse Microsoft, Google, Amazon, Facebook e ora Apple. Anche molti altri protagonisti del mercato al di fuori degli Stati Uniti stanno prendendo parte alla competizione in quest'ambito. Chiaramente, le grandi aziende tecnologiche ritengono che la traduzione automatica e l'elaborazione del linguaggio naturale siano strumenti indispensabili nell'attuale mondo interconnesso e globale.
Tenete d'occhio quest'area mentre Lionbridge segue la competizione. Identificheremo i migliori motori di traduzione automatica in base alle esigenze specifiche di un'azienda, tenendo conto della combinazione linguistica e del tipo di contenuti.
Considerando l'elevato numero di aziende tecnologiche che stanno investendo in questo settore, ci aspettiamo che la corsa allo sviluppo delle tecnologie di traduzione automatica ed elaborazione del linguaggio naturale sia destinata ad accelerare. Senza dubbio Apple, con la sua attenzione ai dettagli e alla qualità, spingerà le altre aziende a fare sempre di più.
—Rafa Moral, Lionbridge Vice President, Innovation