SELECCIONAR IDIOMA:

Modern technology with bright lights

Clasificación de idiomas según su traducibilidad automática para una TA más eficaz

Descubra qué idiomas son más sencillos de traducir para las máquinas antes de incorporar la traducción automática

A medida que las empresas se enfrentan a una mayor presión por traducir más contenido con mayor rapidez, la traducción automática (TA) se ha convertido en un componente esencial de la solución a este reto. Por tanto, resulta interesante comparar el rendimiento de los principales motores de TA (Google NMT, Bing NMT, Amazon, DeepL y Yandex) para determinar cuál de ellos responderá mejor a sus necesidades. De hecho, ya analizamos el rendimiento de los motores de TA todos los meses a través de MT Tracker, la herramienta de medición de los principales motores de traducción automática que más tiempo lleva realizando este seguimiento. Sin embargo, es importante realizar evaluaciones adicionales, sobre todo si tenemos en cuenta que, según nuestro análisis, los motores presentan actualmente un rendimiento similar. 

Para sacar el máximo partido a la TA, también se puede examinar la facilidad con la que los motores de TA traducen un determinado par de lenguas, es decir, la traducibilidad automática de los idiomas. Para ayudarle a comparar distintos idiomas, en la tabla 1 hemos clasificado la traducibilidad automática de los 28 idiomas de destino hacia los que más se traduce desde el inglés.

Razones para estudiar la traducibilidad automática de los pares de idiomas

Identificar el grado de traducibilidad automática de los pares de idiomas le ayudará a asignar un presupuesto al planificar los costes de traducción en todos los idiomas, ya que le permitirá hacerse una idea más precisa de las combinaciones de idiomas en las que será necesario realizar un mayor esfuerzo de traducción. 

Disponer de información sobre la complejidad de un idioma puede ayudarle a respaldar sus decisiones empresariales y a dar respuesta a las siguientes preguntas:

  • ¿Debería destinarse una mayor parte del presupuesto a poseditar las combinaciones de idiomas más complejas?
  • En caso de que el presupuesto sea ajustado, ¿bastará con realizar una posedición básica o una posedición centrada en ciertos aspectos en algunas lenguas? ¿Con qué idiomas debería usar estos métodos de posedición?
  • A la hora de analizar la mejor forma de asignar un presupuesto, ¿debería mi empresa incluir en ese análisis la clasificación de idiomas junto con los factores empresariales y culturales, en especial en los proyectos que disponen de menos fondos? Si en una cultura resulta aceptable un nivel de calidad inferior, ¿debería mi empresa realizar traducciones a un idioma que ocupa un puesto bajo en la clasificación de traducibilidad automática?
Digital stream of information

¿Cómo se calcula el grado de traducibilidad automática?

Determinar el grado de traducibilidad automática de los idiomas no es un proceso sencillo. Existen diferentes problemas que varían en función de cada uno de ellos. Asimismo, lo que se podría considerar un buen rendimiento para un idioma puede ser inadecuado para otro. Sin embargo, hay ciertos parámetros que nos pueden ayudar a llevar a cabo esta evaluación. 

Por ejemplo, la distancia de edición, que representa el número de cambios que se realizan en una posedición para garantizar que el texto final posea la misma calidad que si hubiera sido realizado por un humano, puede dar una idea de la complejidad de un idioma para ayudarnos a determinar el grado de traducibilidad automática para cada par de idiomas, aunque estos parámetros no se suelen emplear en las comparaciones entre idiomas. 

Conclusiones sobre traducibilidad automática de Lionbridge: ¿qué puesto ocupa cada idioma y por qué?

Nuestra clasificación de traducibilidad automática de 28 idiomas de destino se basa en las millones de oraciones que Lionbridge ha procesado a lo largo de los años. 

Los resultados sugieren que existe una correlación entre la complejidad y las familias lingüísticas.  

Las lenguas romances

La mayoría de lenguas romances, como el portugués, el español, el francés y el italiano, necesitan menos cambios para alcanzar un nivel de calidad excelente al traducirse desde el inglés. Hemos detectado que estos idiomas de destino son los más fáciles de procesar para las máquinas y es por eso que ocupan las primeras cuatro posiciones en nuestra clasificación de traducibilidad automática. 

Por su parte, el rumano, la otra lengua perteneciente a la familia romance incluida en esta lista, ocupa una posición inferior en la clasificación, en concreto, el décimo puesto. En el caso de la lengua romance menos traducida, es probable que esto se deba a que el corpus bilingüe empleado para el entrenamiento de los motores de TA es más reducido, así como a la complejidad gramatical del rumano, que presenta ciertas similitudes con el latín.   

Chino simplificado

El chino simplificado, un idioma sin lugar a dudas muy distinto del inglés, ocupa la quinta posición en nuestra lista, inmediatamente después de las cuatro primeras lenguas romances. Creemos que el motivo de que ocupe un puesto tan alto se debe a las frecuentes actualizaciones y mejoras introducidas en la TA para esta combinación de idiomas en los últimos cinco años, tal y como hemos observado en nuestro seguimiento continuo de la TA a lo largo de este período. Las empresas especializadas en TA invierten mucho más en este par de idiomas para generar un mejor rendimiento debido al gran interés comercial que presenta esta combinación. 

Idiomas complejos

Por su parte, el húngaro y el finés, dos idiomas urálicos, son lenguas más complejas y se sitúan en las últimas posiciones de la clasificación, en los puestos 27 y 28. El estonio, otro idioma complejo perteneciente a la misma familia, se sitúa en el puesto 24 de la lista. 

Asimismo, el coreano también se encuentra en la parte baja de la clasificación, concretamente, en el puesto 25.

Person working on computer with analytical data

¿Qué podemos concluir del análisis de la traducibilidad automática?

A pesar de que la comparación entre idiomas tiene sus limitaciones, nuestra clasificación y la correlación que existe entre la complejidad y las familias lingüísticas aportan datos interesantes que le pueden ayudar a gestionar mejor sus proyectos multilingües.

Tabla 1

Clasificación de idiomas en función de su grado de traducibilidad automática

Puesto Idioma (desde el inglés) Puesto Idioma (desde el inglés) Puesto Idioma (desde el inglés)
1 Portugués 11 Tailandés 20 Chino (tradicional)
2 Español 12 Noruego 21 Lituano
3 Francés 13 Alemán 22 Checo
4 Italiano 14 Sueco 23 Árabe
5 Chino (simplificado) 15 Turco 24 Estonio
6 Neerlandés 16 Eslovaco 25 Coreano
7 Danés 17 Hebreo 26 Ruso
8 Japonés 18 Letón 27 Húngaro
9 Griego 19 Polaco 28 Finés
10 Rumano        

Tabla 1

Clasificación de idiomas en función de su grado de traducibilidad automática

Puesto Idioma (desde el inglés)
1 Portugués
2 Español
3 Francés
4 Italiano
5 Chino (simplificado)
6 Neerlandés
7 Danés
8 Japonés
9 Griego
10 Rumano
11 Tailandés
12 Noruego
13 Alemán
14 Sueco
15 Turco
16 Eslovaco
17 Hebreo
18 Letón
19 Polaco
20 Chino (tradicional)
21 Lituano
22 Checo
23 Árabe
24 Estonio
25 Coreano
26 Ruso
27 Húngaro
28 Finés

Contacte con nosotros

Si desea obtener más información sobre cómo Lionbridge puede ayudarle a desarrollar una estrategia de TA eficaz para dar respuesta a sus necesidades de traducción, póngase en contacto con nosotros hoy mismo.

linkedin sharing button
  • #technology
  • #blog_posts
  • #translation_localization

Rafa Moral y Janette Mandell
AUTORES
Rafa Moral y Janette Mandell