Visite Lionbridge Games

SELECCIONAR IDIOMA:

Two separate sets of couples collaborate in a work setting

Diferencias y similitudes entre la personalización y el entrenamiento de la traducción automática

Cuándo usar cada enfoque para mejorar el resultado de la traducción automática

Actualmente, las empresas recurren más que nunca a la traducción automática (TA) y se espera que esas cifras seguirán creciendo. Esta tendencia puede atribuirse al hecho de que la tecnología cada vez ofrece unos resultados más predecibles y a la intensa presión que existe en el mercado por producir más contenido rápidamente en muchas lenguas, todo ello con un presupuesto igual o incluso inferior. La tecnología de TA ofrece traducciones de forma rápida y rentable de un modo que no está al alcance de los traductores humanos; sin embargo, las empresas también deben abordar ciertos problemas relacionados con la calidad. Para triunfar en unos mercados cada vez más digitales, deberán ofrecer contenido multilingüe y personalizado que sea específico de un determinado ámbito, que transmita un determinado tono y que mantenga una voz de marca coherente en todos los canales.

¿Cómo puede sacar el máximo partido de sus iniciativas en materia de TA para conseguir mejor estos objetivos? Existen dos métodos que le permitirán impulsar la eficacia de la traducción automática: la personalización y el entrenamiento. Aunque cada uno de estos enfoques puede mejorar la calidad del resultado de la TA y reducir la necesidad de poseditar un texto, las empresas no pueden usar la personalización y el entrenamiento de manera intercambiable.

Siga leyendo y descubra cómo funcionan ambos métodos, cuáles son sus diferencias y cómo seleccionar el enfoque adecuado en función de cada necesidad.

¿Por qué una empresa no podría confiar únicamente en la TA genérica?

Normalmente, las empresas obtienen los resultados deseados cuando emplean la TA para traducir contenido de carácter general y sencillo procedente de motores genéricos que no han sido entrenados, como Google NMT, Bing NMT, Amazon, DeepL o Yandex. Sin embargo, también existe la posibilidad de que los usuarios no estén satisfechos con el resultado.

Esto se debe a que un motor genérico, a menudo, es incapaz de traducir el contenido con un alto grado de especialización, como sucede en el del sector jurídico o biomédico, ni tampoco las palabras vinculadas con esos ámbitos concretos. La TA no puede saber cuándo debe aplicar de manera adecuada la definición correcta de una palabra que tiene dos significados. Además, tampoco puede mantener una voz de marca única ni determinar cuándo usar los niveles de lenguaje formal o informal para conectar de la mejor manera posible con el público.

La personalización y el entrenamiento de la TA son dos enfoques que abordan estas carencias para conseguir un mejor resultado de traducción cuando existen unos requisitos específicos que los motores genéricos no consiguen satisfacer.

¿Qué es la personalización de la TA?

La personalización consiste en adaptar un motor de TA preexistente con un glosario de traducción y una lista de términos no traducibles (DNT) para mejorar la precisión de las traducciones generadas automáticamente. (Un glosario de traducción es un conjunto de términos importantes para una empresa con sus respectivas traducciones. Una lista de términos no traducibles es un conjunto de términos que una empresa no quiere que se traduzcan).

Para llevar a cabo la personalización de la TA, se carga una lista compuesta por estos términos en la lengua de origen junto con sus respectivas traducciones antes de que el motor ejecute la tarea. Esta lista indica al motor de TA cómo debe traducir los términos o bien impide intencionadamente que se utilicen sus traducciones. Por medio de esta intervención, se mejoran las sugerencias que realiza el motor y la empresa consigue mantener su nombre de marca, respetar una determinada terminología y emplear variantes regionales. Al obtener unas traducciones de mejor calidad, las necesidades de posedición son mucho menores.

La personalización de la TA, por lo general, es más fácil de llevar a cabo que el entrenamiento, si bien es cierto que es necesario tomar ciertas precauciones a la hora de adoptar este enfoque. Aunque cargar términos en un sistema de traducción automática es un proceso sencillo, seleccionar los términos adecuados puede resultar complicado. El éxito de una tarea de personalización de la TA depende en gran medida del nivel de habilidades que tenga el experto en TA, así como de su capacidad para gestionar las reglas de normalización de entrada y salida, las listas de términos no traducibles y los glosarios, pues todos estos aspectos permiten mejorar el resultado. Involuntariamente, los autores con menos experiencia pueden hacer que la TA ofrezca sugerencias deficientes, lo cual repercutirá de manera negativa en la calidad global.

¿Qué es el entrenamiento de la TA?

El entrenamiento de la TA es un proceso en el cual se desarrolla y entrena un motor de TA empleando gran cantidad de datos bilingües procedentes de corpus y memorias de traducción (contenido previamente traducido) para mejorar la precisión de las traducciones generadas automáticamente.

Para ello, el entrenamiento de un motor de TA genérico se alimenta con corpus bilingües específicos de cada empresa. Las entradas se pueden realizar a través de distintos tipos de exportaciones, a menudo en formato de memoria de traducción (TM, por sus siglas en inglés). Además de ofrecer la traducción previamente aprobada, la memoria de traducción ofrece datos similares a metadatos de gran valor, por ejemplo, cuándo se tradujo la oración, quién se encargó de ello y si se trata de una coincidencia exacta o una coincidencia parcial con menor precisión. Estos datos permiten que el motor aprenda qué espera una empresa de la traducción. En lugar de realizar una sugerencia de una traducción genérica basada en lo que el motor considera que es la mejor forma de traducir el texto de origen, se genera un resultado personalizado a partir de los corpus.

El entrenamiento de la TA permite a una empresa perfeccionar sus resultados para conseguir un estilo o una voz de marca específicos gracias a la capacidad del motor para elaborar traducciones más coherentes. Se puede omitir la configuración por defecto de los motores de TA genéricos que producen un tono formal para conseguir, en su lugar, un tono informal. Al igual que sucede con la personalización de la TA, una empresa podrá conseguir los resultados deseados sin necesidad de realizar una posedición muy exhaustiva, ya que el motor tiene mayor capacidad para generar traducciones precisas y con menos errores.

Durante el entrenamiento de la TA, la empresa debe suministrar al motor la mayor cantidad de conocimiento posible. Cabe señalar que cuanto mayor calidad tengan los segmentos de entrada, mejor calidad tendrán los resultados. Para llevar a cabo un buen entrenamiento de la TA, es necesario que la empresa suministre al motor un mínimo de 15 000 segmentos bilingües únicos de gran calidad, sin incoherencias ni duplicaciones de las traducciones del texto de origen. Si la empresa no cumple estos requisitos mínimos, es probable que el entrenamiento no tenga un impacto notable en el resultado o, incluso, que no tenga repercusión alguna.

¿Cuál es la diferencia entre la personalización y el entrenamiento de la TA?

Aunque los dos enfoques resultan adecuados para mejorar el resultado de la TA y reducir la necesidad de poseditar el texto, las similitudes entre ambos terminan ahí. No son intercambiables.

En esencia, la diferencia entre estos dos métodos es que la personalización adapta un motor de TA preexistente con ayuda de glosarios y listas de términos no traducibles, mientras que el entrenamiento desarrolla y entrena un motor desde cero por medio de multitud de datos bilingües procedentes de corpus y memorias de traducción.

La personalización es más versátil que el entrenamiento y generará sugerencias que cumplirán los requisitos de la mayoría de las empresas. Sin embargo, la personalización supone un coste puntual que incluye la actualización del perfil que se introduce en el motor de TA. El mantenimiento del glosario a lo largo del tiempo entraña algunos costes adicionales.

El entrenamiento resulta más adecuado para empresas más sofisticadas que poseen contenido muy especializado y casos prácticos complejos. A la hora de entrenar una TA, el primer entrenamiento entraña algunos costes, y lo mismo sucede en caso de que sea necesario realizar un entrenamiento adicional, algo que se podría contemplar con el paso del tiempo si al supervisar el rendimiento de la TA se pone de manifiesto que existe cierto margen de mejora.

A geographic pattern overlays a cityscape at night

¿Cuándo se debería plantear mi empresa recurrir al entrenamiento o a la personalización de la TA?

¿Su empresa necesita traducir materiales científicos o manuales con un alto grado técnico? ¿Tiene que mantener una voz de marca única? Las respuestas que dé a estas preguntas le ayudarán a determinar si en su caso resulta más adecuada la personalización o el entrenamiento de la TA.

Cuándo recurrir a la personalización de la TA

Existen dos situaciones destacadas en las que es recomendable recurrir a la personalización de la TA. Adopte este enfoque cuando tenga que conseguir lo siguiente:

  • Traducciones de terminología precisas
  • Introducción de variantes regionales, por ejemplo, inglés (Estados Unidos) o inglés (Reino Unido), cuando no dispone de datos suficientes para realizar un entrenamiento

La personalización de la TA es una buena opción para el contenido tecnológico y más enfocado a los detalles, puesto que en este tipo de contenido resulta esencial traducir la terminología correctamente. Además, la personalización de la TA es el enfoque preferido cuando no se dispone de datos suficientes para conseguir un entrenamiento eficaz de la TA.

Cuándo recurrir al entrenamiento de la TA

Existen dos situaciones destacadas en las que es recomendable recurrir al entrenamiento de la TA. Adopte este enfoque cuando tenga que conseguir lo siguiente:

  • Una voz, un tono o un estilo de marca concretos y reducir la necesidad de realizar una posedición exhaustiva
  • Introducción de variantes regionales del idioma de destino (como francés de Suiza o francés de Francia) cuando se dispone de datos suficientes para llevar a cabo los entrenamientos

El entrenamiento de la TA es una buena opción para traducir contenido de marketing y creativo, ya que este tipo de contenido se caracteriza por ciertos elementos esenciales, como son una voz, un tono y un estilo de marca específicos. Sin embargo, es necesario asegurarse de que posee datos suficientes para entrenar a los motores como es debido.

Un enfoque híbrido

En ocasiones, para obtener los mejores resultados deberá optarse por un enfoque híbrido. Por ejemplo, la TA puede generar mejores sugerencias cuando las empresas añaden cierto grado de personalización al entrenamiento de la TA.

Lionbridge ayuda a sus clientes a poner en práctica un enfoque híbrido de manera sencilla. Gracias a la solución de TA para empresas de Lionbridge, el portal Smart MT™, los clientes pueden personalizar sus respectivas TA y, al mismo tiempo, optar por recurrir a los servicios de entrenamiento profesional de los equipos de Lionbridge, compuestos por expertos altamente cualificados. Al trabajar con estos equipos, las empresas normalmente adoptan un enfoque con respecto a la TA más integral y, a menudo, emplean una combinación de entrenamiento y personalización de la TA para obtener el mejor resultado. Posteriormente, deberán realizar distintas pruebas que les permitirán entender mejor cuál de los dos enfoques ofrece mejores resultados y que guiarán el desarrollo de un enfoque de la TA a medida.

Personalización y entrenamiento de la TA: ¿cuál es la mejor estrategia?

La selección del mejor enfoque para perfeccionar el resultado de la TA depende de la situación de cada empresa. Al analizar las distintas opciones, puede resultar tentador pensar que el entrenamiento de la TA es el mejor y único método posible para sacar el máximo partido de la TA. O quizás puede que le intrigue todo el bombo que existe en torno al entrenamiento continuo. A continuación, se recogen algunas de las cuestiones que es necesario tener en cuenta al analizar las opciones disponibles.

Trampa n.º 1 que se debe evitar: la oferta de entrenamiento de TA es la única solución

El entrenamiento de la TA puede constituir una herramienta muy eficaz para conseguir un mejor resultado de la TA, pero solo cuando aborda dudas identificadas y especificadas.

Con el incremento en el uso de la TA, muchos proveedores recurren al entrenamiento de la TA como primera opción para tratar de ofrecer valor a sus clientes. Sin embargo, en algunos casos, este enfoque puede resultar contraproducente. Algunas empresas que han empleado únicamente el entrenamiento con la esperanza de obtener un mejor resultado de la TA han recurrido posteriormente a los servicios de Lionbridge y han mostrado su decepción con el entrenamiento después de haber analizado la relación entre costes y beneficios. No se mostraban impresionados por las sugerencias generadas por el motor y buscaban una solución más rentable. ¿A qué se debía su insatisfacción? En pocas palabras, había otros enfoques que se adaptaban mejor a sus circunstancias particulares.

Los proveedores de TA innovadores, como Lionbridge, emplean el entrenamiento de la TA únicamente cuando resulta adecuado, pero recurren mucho a la personalización para conseguir los resultados de la TA que desean por un menor precio que el del entrenamiento de la TA.

Trampa n.º 2 que se debe evitar: el bombo que rodea al entrenamiento continuo durante el entrenamiento de la TA

Al estudiar las distintas soluciones de TA, es posible encontrar proveedores que promueven el concepto del entrenamiento continuado de los motores una vez completados los proyectos individuales. No se deje arrastrar por esas afirmaciones. El entrenamiento continuo solo es posible si cuenta con motores a medida que exigen una actualización constante.

Queremos hacer hincapié en que el entrenamiento de la TA solo tendrá éxito si un proyecto individual cuenta, como mínimo, con 15 000 segmentos únicos para entrenar el motor. Cuando las empresas no poseen datos suficientes, pueden emplear contenido del proyecto para actualizar ciertas características de personalización, algo que en muchos casos se denomina «entrenamiento».

Conclusión

La personalización es una herramienta más versátil que el entrenamiento de la TA, pues generará sugerencias de TA que se ajustarán a los requisitos de la mayoría de las empresas. Con la personalización, se pueden mejorar las sugerencias de la TA lo suficiente como para mantener el nombre de marca y respetar la terminología, con lo cual se reduce el trabajo que debe realizar un poseditor para verificar estos elementos. Normalmente, el coste puntual que entraña actualizar el perfil introducido en el motor de la TA y algunos costes continuos destinados al mantenimiento de un glosario a lo largo del tiempo son inferiores que los costes asociados al entrenamiento de la TA.

A geographic pattern overlays a cityscape at night

¿Cuáles son las mejores prácticas en torno a la personalización de la TA?

A la hora de poner en marcha la personalización de la TA, no se olvide de seguir las mejores prácticas.

Reglas de normalización de entrada y salida

Instaure una biblioteca de reglas de normalización de entrada y salida para las lenguas más usadas; de este modo podrá controlar la introducción de texto en la TA y mejorar los resultados obtenidos. Estas reglas le permitirán responder a los requisitos concretos que posea.

Por ejemplo, una regla de normalización de entrada puede consistir en indicar al motor de TA que utilice comillas latinas [« … »] y evite las inglesas [“...”] en sus traducciones hacia el francés. Gracias a esta regla, se consiguen mejores resultados en las traducciones al francés, ya que los lectores que hablan francés esperan ver comillas latinas y no inglesas. Las empresas pueden aplicar reglas de normalización de entrada y salida para introducir modificaciones similares que se encargan de gestionar las variantes regionales de las lenguas más destacadas (como el francés de Bélgica, el francés de Canadá, el francés de África, etc.).

Reglas y listas de términos no traducibles

Elabore una lista de términos que no quiere que se traduzcan y una regla que sustituya con un token todos los términos identificados que pertenezcan a la lista de no traducibles antes de enviar el texto al motor. Con esta acción, el motor no podrá ver el término en cuestión y, por tanto, no lo traducirá. Una vez procesada la traducción y enviada la sugerencia de la TA, configure la regla de normalización de salida de manera que el motor sustituya el token por el término de la lista de no traducibles.

Preparación de glosarios

Prepare el glosario con atención, ya que esto le permitirá conseguir traducciones precisas y coherentes. A la hora de decidir si incluir un término en el glosario, tenga en cuenta los factores clave que se recogen en la tabla 1.

Directrices generales para la elaboración de glosarios

Factores que se deben contemplar Qué hay que preguntarse ¿El término debería incluirse en el glosario?*
Frecuencia ¿Con qué frecuencia aparece el término en el texto de origen? Si el término aparece con poca frecuencia, no hay que incluirlo.
Ambigüedad ¿El término tiene múltiples significados o puede confundirse fácilmente con otras palabras? Si el término es ambiguo, hay que incluirlo. (Nota: Es necesario asegurarse de que los significados alternativos del término apenas aparezcan en el texto de origen.)
Terminología especializada ¿El término es específico de un ámbito concreto o de un área de estudio? De ser así, hay que incluirlo.
Coherencia ¿El término se ha traducido de manera coherente anteriormente? De ser así, no hay que incluirlo.
Relevancia ¿Qué relevancia tiene el término para el significado global del texto? Si es esencial para el significado del texto, hay que incluirlo.
Complejidad ¿El término es complejo y será difícil que el sistema de traducción automática lo traduzca con precisión? De ser así, hay que incluirlo.

Tabla 1. Factores que se deberán tener en cuenta a la hora de crear un glosario.

*Puede haber excepciones a estas directrices generales.

Qué hacer y qué no hacer

A la hora de crear un glosario, también recomendamos lo siguiente:

  • No se deben incluir términos genéricos (por ejemplo, palabras simples, verbos y adjetivos) que no den buenos resultados con la TA y que puedan influir de manera negativa en la calidad general, la construcción de oraciones, la concordancia y el orden de las palabras.
  • No se deben dividir los términos largos.
  • No se deben incluir términos conflictivos.
  • No se deben incluir entradas duplicadas.
  • Hay que utilizar una sola entrada para cada término en la lengua de origen.
  • Hay que utilizar expresiones con múltiples palabras.
  • Hay que utilizar nombres de productos específicos.
  • Hay que emplear términos no traducibles.

¿Qué enfoque adopta Lionbridge en relación con la personalización y el entrenamiento de la TA?

Gracias al portal Smart MT de Lionbridge, nuestros clientes pueden llevar a cabo fácilmente una personalización de la TA; además, esta tecnología permite personalizar al mismo tiempo múltiples motores de TA. Primero, el cliente elabora las listas de términos no traducibles y los glosarios para la TA y, a continuación, carga dichos términos, que, posteriormente, se utilizarán en todos los motores de TA. Con esta tecnología, podrá evitar los bloqueos de motores y alternar entre los distintos motores en cualquier momento para obtener los mejores resultados.

Además, también resulta sencillo complementar nuestra tecnología de TA con los servicios relevantes que prestan nuestros expertos en TA. Cuando recurren a nosotros, ayudamos a las empresas a identificar la estrategia de TA más eficaz y explicamos cómo ejecutar dicha estrategia de la mejor manera posible.

Tenemos la solución perfecta para todo tipo de necesidades: para aquellos que comienzan a analizar el posible uso de la TA, para aquellos que quieren introducir una personalización para mejorar sus actividades en relación con la TA o para aquellos que hayan experimentado un aumento en su volumen de contenido y para los cuales el entrenamiento de la TA se convierte en una opción viable.

¿Qué diferencias y similitudes existen entre el entrenamiento y la personalización de la traducción automática?

Consulte la tabla 2 para ver una comparativa entre las particularidades del entrenamiento y la personalización de la TA y descubra qué método resulta más adecuado para su contenido.

Diferencias y similitudes entre la personalización y el entrenamiento de la traducción automática

  Personalización de la TA Entrenamiento de la TA
Qué es y cómo funciona Se trata de la adaptación de un motor de traducción automática preexistente con un glosario y una lista de términos no traducibles para mejorar la precisión de las traducciones generadas automáticamente. Consiste en el desarrollo y el entrenamiento de un motor de TA empleando amplios datos bilingües procedentes de corpus y memorias de traducción (TM) con el fin de mejorar la precisión de las traducciones generadas automáticamente.
¿Qué hace? Mejora las sugerencias de la TA para obtener resultados más precisos y reduce la necesidad de realizar una posedición exhaustiva. Mejora las sugerencias de la TA para obtener resultados más precisos y reduce la necesidad de realizar una posedición exhaustiva.
Ventajas específicas Permite a las empresas mantener su nombre de marca y la terminología correspondiente, así como introducir variantes regionales. Permite a las empresas obtener una voz, un tono y un estilo de marca específicos e introducir variantes regionales.
Riesgos que plantea su uso Cuando no se ejecuta correctamente, la TA podría realizar sugerencias deficientes e influir de manera negativa en la calidad global del resultado. Si no hay suficientes datos de calidad para entrenar al motor, el entrenamiento de la TA podría no tener repercusión alguna en el resultado. En los textos de redactores con poca experiencia que hagan un uso excesivo de la terminología, la TA podría generar sugerencias deficientes y repercutir de manera negativa en la calidad global.
¿Cuándo se debe utilizar? Ideal para contenido tecnológico y centrado en los detalles, así como para cualquier otro en el que se necesiten:
*Traducciones precisas de terminología
*Variantes regionales, cuando se carece de datos suficientes para entrenar la TA
Ideal para contenido muy especializado y creativo, marketing y cualquier otro contenido en el que se necesite:
*Una voz, un tono o un estilo de marca concretos
*Variantes regionales, cuanto existen datos suficientes para el entrenamiento de la TA
Factores que contribuyen a un buen resultado Un experto en TA con experiencia que pueda gestionar correctamente las reglas de normalización de entrada y salida, los glosarios y las listas de términos no traducibles. Un mínimo de 15 000 segmentos únicos para entrenar de manera adecuada al motor.
Cuestiones relacionadas con el coste Existe un coste puntual en concepto de actualización del perfil introducido en el motor de TA y ciertos costes continuos destinados al mantenimiento del glosario a lo largo del tiempo. Los costes son relativamente asequibles si se tienen en cuenta los posibles beneficios de esta técnica y, por lo general, inferiores a los que entraña el entrenamiento de un motor de TA. El primer entrenamiento conlleva ciertos costes y existe la posibilidad de que se apliquen otros costes para llevar a cabo un entrenamiento adicional, que se podría contemplar con el paso del tiempo si tras supervisar el rendimiento de la TA se determina que presenta cierto margen de mejora. Si se tienen en cuenta los posibles beneficios, puede merecer la pena invertir en el entrenamiento de la TA.

Tabla 2. Comparativa entre la personalización y el entrenamiento de la TA

Póngase en contacto con nosotros

¿Le gustaría analizar más en detalle cómo podemos ayudarle a aprovechar por completo la traducción automática? Póngase en contacto con nosotros hoy mismo.

linkedin sharing button

Thomas McCarthy y Janette Mandell
AUTORES
Thomas McCarthy y Janette Mandell
  • #ai
  • #blog_posts
  • #translation_localization