Comentario de los expertos de Lionbridge: análisis de la traducción automática

Los expertos en tecnología de Lionbridge analizan los paradigmas de la traducción automática y la IA generativa y comparten sus conclusiones sobre las tendencias más recientes en traducción automática.

CONTACTE CON NOSOTROS

A pesar de la naturaleza disruptiva de la IA generativa, la tecnología de traducción automática mantiene su relevancia

Un sinfín de cambios: entender los avances en la traducción automática

Llevamos un tiempo advirtiendo de que el paradigma de la traducción automática (TA) estaba ya lo bastante maduro como para experimentar un cambio. ¿Quiere saber por qué? Lea los comentarios de nuestro experto.

Nuestros expertos en traducción automática ofrecen información sobre numerosos temas, entre otros:

El rendimiento de los motores de TA y los modelos de IA generativa en ciertos momentos y las implicaciones que tienen estos resultados en un contexto más amplio
Las limitaciones que presentan las herramientas de traducción automática
Formas de mejorar la eficacia de la traducción automática

Cuanto mejor entienda la TA y la IA generativa, mejor podrá implantar las herramientas de manera selectiva para dar respuesta a sus necesidades. Aproveche los puntos fuertes que ofrece cada paradigma para lograr, en última instancia, la máxima eficiencia de la traducción, mejores resultados con el contenido y ahorros de costes.

Comentario destacado del experto de Lionbridge

Peculiaridades de GPT-4 dignas de mención: octubre de 2023

A tenor del predominio y del potencial de la IA generativa y los modelos lingüísticos de gran tamaño, hemos mejorado el informe de la herramienta de seguimiento de la calidad de la traducción automática de Lionbridge. A partir de ahora, el informe incluirá los resultados de traducción de GPT-4, además de los de GPT-3.5 y Davinci y, como no podía ser de otra forma, los relacionados con el rendimiento del motor de TA neuronal.

¿Cuáles son nuestros últimos hallazgos? Algunas peculiaridades de GPT-4 dignas de mención.

Hemos detectado varios problemas en relación con GPT-4, entre los que se incluyen un bajo rendimiento, su incapacidad para ofrecer traducciones por diversos motivos y un comportamiento incoherente, por ejemplo, la ausencia de traducciones en algunas peticiones dentro de un conjunto.

Hallazgo n.º 1: GPT-4 no traduce algunos textos

GPT-4 no tradujo una oración concreta de nuestro conjunto para pruebas para la TA.

Tras analizar esta cuestión, hemos concluido que el problema residía en la presencia de un término con cierta connotación sexual en determinados contextos. Queremos dejar claro que la oración que utilizamos en nuestra prueba era completamente normal y aceptable. Sin embargo, por algún motivo, el término activó el filtro de contenido sexual GPT-4; posteriormente, la IA censuró la traducción de esa oración y, en consecuencia, no generó ningún resultado. Este resultado nos sorprendió por dos motivos:

Al usar ese término de manera aislada, no se produjo problema alguno.

El contexto de esa oración en concreto no tenía ninguna interpretación problemática.

Esta observación nos llevó a concluir que, quizás, una parte del mecanismo de filtrado de GPT-4 se basaba en una lista sencilla de palabras prohibidas que también incluye términos ambiguos. Este enfoque resulta problemático, ya que tiende a activarse en exceso y a provocar falsos positivos, un problema grave en el contexto de la traducción profesional.

Puesto que las anteriores tecnologías de traducción automática, como los motores de TA neuronal, no presentan este tipo de problema de filtrado de contenido, podemos concluir que se trata de una limitación propia de las tecnologías de LLM.

En contextos reales, esta limitación posee ciertas implicaciones. Por ejemplo, en el caso de que haya que traducir contenido médico relacionado con la ginecología o la educación sexual. Quizá le sorprenda comprobar que el LLM no traducirá parte del texto.

Lo más interesante es que este problema solamente apareció cuando tradujimos esta oración hacia un idioma en concreto, el chino, pero no al traducir hacia otras lenguas. Este resultado sugiere que el filtro se encontraba en el resultado de GPT-4. La solución consiste en desactivar los filtros de contenido para tareas de traducción.

Hallazgo n.º 2: variabilidad en el resultado de GPT-4

Tras cinco semanas de seguimiento, descubrimos que la traducción automática que ofrece el LLM genera resultados muy variables, especialmente en el caso de GPT-4.

Aunque esperábamos este resultado en el caso de la IA generativa, la variabilidad fue mucho más relevante de lo previsto, incluso cuando utilizamos los ajustes del parámetro de temperatura y máxima probabilidad (Top_p) para reducir la creatividad y lograr un resultado más determinista. El resultado de la traducción fue diferente cada una de las veces que ejecutamos GPT, incluso cuando realizamos las traducciones una tras otra.

Aunque difieren, las dos traducciones pueden ser aceptables. Sin embargo, este es otro aspecto que se debe controlar y que marca otra diferencia con respecto al paradigma anterior de la TA neuronal.

Por todo ello, comenzamos a intuir que este posible cambio de paradigma, de la TA neuronal a la TA mediante LLM, puede constituir no solo un cambio tecnológico, sino que también exige un cambio de mentalidad por nuestra parte. Es posible que tengamos que estar preparados para convivir con resultados menos deterministas, incluso cuando se utiliza el mismo texto de entrada y los mismos parámetros, y esperamos observar una mayor variabilidad de la que solíamos observar con la automatización actual.

Aunque en cierto modo es posible que tengamos que convivir con un mayor grado de incertidumbre, es posible utilizar algunos mecanismos y prácticas recomendadas para conseguir que esa variabilidad sea, hasta cierto punto, controlable.

Por último, al examinar nuestro gráfico, se observa que la reducción en la distancia de edición de GPT-4 no indica una menor calidad, sino que se trata de un simple reflejo de la variabilidad que presentan los resultados de GPT. Es posible que, el próximo mes, se observe una subida en esta línea. No se pierda este espacio para descubrir los futuros avances y obtener más información.

—Rafa Moral, vicepresidente de Innovación de Lionbridge

Índice de temas del comentario del experto

Examine los resúmenes ejecutivos que se muestran a continuación para obtener más información sobre los temas analizados en nuestros anteriores comentarios.

Marzo de 2023 — Un modelo lingüístico de gran tamaño (LLM) obtiene un mejor resultado que un motor de traducción automática (TA) neuronal: ¿y ahora qué?

Febrero de 2023: mejora de la traducción automática (TA): personalización y entrenamiento de la TA

Enero de 2023: comparación del grado de calidad de la traducción realizada por ChatGPT y los principales motores de TA

Noviembre de 2022: mejora de los resultados de la TA de Microsoft

Octubre de 2022: TA y grado de formalidad de un idioma

Septiembre de 2022: uso de la terminología para mejorar la calidad de la TA

Agosto de 2022: evitar los errores catastróficos durante la traducción automática

Julio de 2022: clasificación de idiomas para TA

Junio de 2022: análisis preciso de la calidad de la TA

Mayo de 2022: rendimiento de Amazon y Yandex en el mes de mayo

Abril de 2022: rendimiento de Yandex en el mes de abril

Marzo de 2022: comparativas personalizadas de TA

Febrero de 2022: el futuro de la traducción automática neuronal

Enero de 2022: rendimiento de los motores de TA en enero

Diciembre de 2021: Lionbridge añade Yandex a sus análisis comparativos de calidad de la TA

Noviembre de 2021: Bing Translator introduce mejoras

Octubre de 2021: evolución del motor de TA de Amazon

Septiembre de 2021: Amazon introduce mejoras en la calidad de la TA

Agosto de 2021: principales empresas tecnológicas y evolución de sus motores de TA

Lionbridge Machine Translation Tracker

La herramienta Machine Translation Tracker de Lionbridge es el sistema de evaluación de los principales motores de TA del sector con una trayectoria más dilatada.

Mide el rendimiento global de los cinco principales motores de TA neuronales y de varios modelos de IA generativa. Además, evalúa la calidad de la traducción a partir de ciertos pares de lenguas y en determinados ámbitos. La IA generativa no presenta un rendimiento superior al de los principales motores de TA neuronal, salvo en algunos casos. Sin embargo, estos modelos producen unos resultados decentes, especialmente teniendo en cuenta que no han sido entrenados expresamente para tareas de traducción.

¿Cuál es la conclusión? En medio del gran interés que existe en torno a la implantación de la IA generativa o los LLM, la traducción automática tradicional sigue resultando una herramienta útil.

Los resultados de traducción cambian constantemente y la herramienta recoge esas fluctuaciones.

Ir a la herramienta

Comentarios del experto de Lionbridge

Obtenga más información de la mano de nuestros expertos en traducción automática.

Marzo de 2023

La inteligencia artificial (IA) generativa ha alcanzado un hito importante, pues ha presentado un mejor rendimiento que un motor de traducción automática (TA) neuronal en una de nuestras evaluaciones comparativas. En concreto, el modelo lingüístico de gran tamaño (LLM) GPT-4 obtuvo una calidad ligeramente superior a la de Yandex en la combinación del inglés hacia el chino, como se muestra en la figura 1.

Este avance es muy notable, ya que es la primera vez que un tipo de enfoque de TA distinto supera a un motor de TA neuronal desde la aparición de esta. Además, ha sido un enfoque que no se basa en la TA, una automatización lingüística para múltiples fines que no está pensada específicamente para la traducción automática, el que ha vencido a un motor de TA neuronal.

¿Por qué no debería ignorar este suceso? Si usted es un prestador de TA y quiere seguir siendo competitivo, deberá situarse a la vanguardia de los avances tecnológicos y analizar el impacto que estos tendrán en su oferta actual de TA. En cambio, si usted es una persona que adquiere una TA, deberá estar al tanto de estas innovaciones para realizar buenas inversiones en TA, lo cual, probablemente, incluirá algunas tecnologías basadas en LLM en lugar de soluciones de traducción automática neuronal pura.

Cabe mencionar que la IA generativa todavía se encuentra en sus primeras fases, por consiguiente, presenta ciertas carencias en algunos ámbitos clave. Por ejemplo, genera resultados variables a lo largo de múltiples repeticiones, su interfaz de programación de aplicaciones (API) es inestable y comete más errores que los motores de TA neuronales. Para que la tecnología pueda madurar, es imprescindible solucionar estos problemas y, de hecho, ya vemos ciertas mejoras que se están consiguiendo a una velocidad de vértigo.

La increíble velocidad a la que se pueden mejorar los LLM respalda la idea de que esta tecnología se convertirá en el siguiente paradigma de la traducción automática. De acuerdo con nuestras previsiones, nos adentramos en un período híbrido en el que los prestadores de TA neuronal integrarán algunos aspectos de los LLM en la arquitectura de la TA neuronal mientras evoluciona el paradigma.

Lea nuestro artículo del blog para ver una comparación de la calidad de la traducción que ofrecen la TA neuronal y los LLM en dos combinaciones lingüísticas distintas y para conocer nuestra opinión sobre si nos encontramos ante el principio del fin del paradigma de la traducción automática neuronal.

—Rafa Moral, vicepresidente de Innovación de Lionbridge

	Personalización de la TA
Qué es y cómo funciona	Se trata de la adaptación de un motor de traducción automática preexistente con un glosario y una lista de términos no traducibles para mejorar la precisión de las traducciones generadas automáticamente.
¿Qué hace?	Mejora las sugerencias de la TA para obtener resultados más precisos y reduce la necesidad de realizar una posedición exhaustiva.
Ventajas específicas	Permite a las empresas mantener su nombre de marca y la terminología correspondiente, así como introducir variantes regionales.
Riesgos que plantea su uso	Cuando no se ejecuta correctamente, la TA podría realizar sugerencias deficientes e influir de manera negativa en la calidad global del resultado.
¿Cuándo se debe utilizar?	Ideal para contenido tecnológico y centrado en los detalles, así como para cualquier otro en el que se necesiten: Traducciones precisas de terminología Variantes regionales, cuando se carece de datos suficientes para entrenar la TA
Factores que contribuyen a un buen resultado	Un experto en TA con experiencia que pueda gestionar correctamente las reglas de normalización de entrada y salida, los glosarios y las listas de términos no traducibles.
Cuestiones relacionadas con el coste	Existe un coste puntual en concepto de actualización del perfil introducido en el motor de TA y ciertos costes continuos destinados al mantenimiento del glosario a lo largo del tiempo. Los costes son relativamente asequibles si se tienen en cuenta los posibles beneficios de esta técnica y, por lo general, inferiores a los que entraña el entrenamiento de un motor de TA.

	Entrenamiento de la TA
Qué es y cómo funciona	Consiste en el desarrollo y el entrenamiento de un motor de TA empleando amplios datos bilingües procedentes de corpus y memorias de traducción (TM) con el fin de mejorar la precisión de las traducciones generadas automáticamente.
¿Qué hace?	Mejora las sugerencias de la TA para obtener resultados más precisos y reduce la necesidad de realizar una posedición exhaustiva.
Ventajas específicas	Permite a las empresas obtener una voz, un tono y un estilo de marca específicos e introducir variantes regionales.
Riesgos que plantea su uso	Si no hay suficientes datos de calidad para entrenar al motor, el entrenamiento de la TA podría no tener repercusión alguna en el resultado. En los textos de redactores con poca experiencia que hagan un uso excesivo de la terminología, la TA podría generar sugerencias deficientes y repercutir de manera negativa en la calidad global.
¿Cuándo se debe utilizar?	Ideal para contenido muy especializado y creativo, marketing y cualquier otro contenido en el que se necesite: Una voz, un tono o un estilo de marca concretos Variantes regionales, cuanto existen datos suficientes para el entrenamiento de la TA
Factores que contribuyen a un buen resultado	Un mínimo de 15 000 segmentos únicos para entrenar de manera adecuada al motor.
Cuestiones relacionadas con el coste	El primer entrenamiento conlleva ciertos costes y existe la posibilidad de que se apliquen otros costes para llevar a cabo un entrenamiento adicional, que se podría contemplar con el paso del tiempo si tras supervisar el rendimiento de la TA se determina que presenta cierto margen de mejora. Si se tienen en cuenta los posibles beneficios, puede merecer la pena invertir en el entrenamiento de la TA.

	Personalización de la TA	Entrenamiento de la TA
Qué es y cómo funciona	Se trata de la adaptación de un motor de traducción automática preexistente con un glosario y una lista de términos no traducibles para mejorar la precisión de las traducciones generadas automáticamente.	Consiste en el desarrollo y el entrenamiento de un motor de TA empleando amplios datos bilingües procedentes de corpus y memorias de traducción (TM) con el fin de mejorar la precisión de las traducciones generadas automáticamente.
¿Qué hace?	Mejora las sugerencias de la TA para obtener resultados más precisos y reduce la necesidad de realizar una posedición exhaustiva.	Mejora las sugerencias de la TA para obtener resultados más precisos y reduce la necesidad de realizar una posedición exhaustiva.
Ventajas específicas	Permite a las empresas mantener su nombre de marca y la terminología correspondiente, así como introducir variantes regionales.	Permite a las empresas obtener una voz, un tono y un estilo de marca específicos e introducir variantes regionales.
Riesgos que plantea su uso	Cuando no se ejecuta correctamente, la TA podría realizar sugerencias deficientes e influir de manera negativa en la calidad global del resultado.	Si no hay suficientes datos de calidad para entrenar al motor, el entrenamiento de la TA podría no tener repercusión alguna en el resultado. En los textos de redactores con poca experiencia que hagan un uso excesivo de la terminología, la TA podría generar sugerencias deficientes y repercutir de manera negativa en la calidad global.
¿Cuándo se debe utilizar?	Ideal para contenido tecnológico y centrado en los detalles, así como para cualquier otro en el que se necesiten: Traducciones precisas de terminología Variantes regionales, cuando se carece de datos suficientes para entrenar la TA	Ideal para contenido muy especializado y creativo, marketing y cualquier otro contenido en el que se necesite: Una voz, un tono o un estilo de marca concretos Variantes regionales, cuanto existen datos suficientes para el entrenamiento de la TA
Factores que contribuyen a un buen resultado	Un experto en TA con experiencia que pueda gestionar correctamente las reglas de normalización de entrada y salida, los glosarios y las listas de términos no traducibles.	Un mínimo de 15 000 segmentos únicos para entrenar de manera adecuada al motor.
Cuestiones relacionadas con el coste	Existe un coste puntual en concepto de actualización del perfil introducido en el motor de TA y ciertos costes continuos destinados al mantenimiento del glosario a lo largo del tiempo. Los costes son relativamente asequibles si se tienen en cuenta los posibles beneficios de esta técnica y, por lo general, inferiores a los que entraña el entrenamiento de un motor de TA.	El primer entrenamiento conlleva ciertos costes y existe la posibilidad de que se apliquen otros costes para llevar a cabo un entrenamiento adicional, que se podría contemplar con el paso del tiempo si tras supervisar el rendimiento de la TA se determina que presenta cierto margen de mejora. Si se tienen en cuenta los posibles beneficios, puede merecer la pena invertir en el entrenamiento de la TA.

QUÉ HACEMOS

SECTORES

RECURSOS

QUIÉNES SOMOS

Comentario de los expertos de Lionbridge: análisis de la traducción automática

A pesar de la naturaleza disruptiva de la IA generativa, la tecnología de traducción automática mantiene su relevancia

Un sinfín de cambios: entender los avances en la traducción automática

Comentario destacado del experto de Lionbridge

Peculiaridades de GPT-4 dignas de mención: octubre de 2023

¿Cuáles son nuestros últimos hallazgos? Algunas peculiaridades de GPT-4 dignas de mención.

Hallazgo n.º 1: GPT-4 no traduce algunos textos

Hallazgo n.º 2: variabilidad en el resultado de GPT-4

Índice de temas del comentario del experto

Lionbridge Machine Translation Tracker

Comentarios del experto de Lionbridge

Marzo de 2023

Febrero de 2023

Diferencias y similitudes entre la personalización y el entrenamiento de la traducción automática

Enero de 2023

Noviembre de 2022

Octubre de 2022

Septiembre de 2022

Agosto de 2022

Julio de 2022

Junio de 2022

Mayo de 2022

Abril de 2022

Marzo de 2022

Febrero de 2022

Enero de 2022

Diciembre de 2021

Noviembre de 2021

Octubre de 2021

Septiembre de 2021

Agosto de 2021

Conozca a los expertos en traducción automática de Lionbridge

Rafa Moral

Yolanda Martin

Thomas McCarthy

Rellene nuestro formulario de contacto para hablar con nosotros.

Envíenos un mensaje para explicarnos sus necesidades o solicitar más información sobre nuestros servicios y precios. Estamos siempre a su disposición. Escríbanos para decirnos en qué podemos ayudarle. Si le interesa trabajar para Lionbridge, visite la página "Únase a nosotros".

Hablemos

SECTORES