En el mundo se hablan miles de idiomas y dialectos, lo que constituye una barrera importante en la comunicación entre personas, administraciones y empresas. La traducción automática (machine translation en inglés) es una herramienta imprescindible que permite reducir dicha barrera, ya que posibilita la traducción de textos y voz en dispositivos electrónicos.
Aunque las cifras varían según las fuentes, el tamaño del mercado de la traducción en el mundo podría superar los 12 mil millones de dólares al año. Por otra parte, el número de empresas que dan servicios de traducción superan las tres mil.
El concepto de la traducción automática viene de antiguo, pero hasta la segunda mitad del siglo pasado no se materializa en sistemas funcionales. Los primeros sistemas estuvieron basados en la transferencia a los computadores del conocimiento que poseen los humanos sobre traducción. Este conocimiento se representaba en forma de reglas. La construcción de tales sistemas era un proceso costoso en todos los sentidos.
Traductores a partir de datos
A finales de la década de los 80 se propone una aproximación basada en la construcción automática de traductores a partir de conjuntos existentes de traducciones (corpora bilingües). En esta aproximación se utilizaban técnicas de aprendizaje automático (machine learning) y, concretamente, técnicas estadísticas para construir los correspondientes modelos. Esto dio lugar a lo que se conoce como traducción automática estadística (statistical machine translation).
Estos modelos utilizan probabilidades para relacionar palabras o secuencias de palabras con sus posibles traducciones. Aunque esta idea tampoco era nueva, la propuesta de modelos muy sofisticados y la potencia de los computadores de la época permitieron construir traductores automáticos muy competitivos. De hecho, la calidad de las traducciones era equivalente o mejor que la de los sistemas existentes y con un coste de desarrollo muy inferior.
Pero los sistemas así construidos presentaban un problema importante: la necesidad de disponer de corpora bilingües de un cierto tamaño. Por otra parte, los traductores obtenidos solo eran adecuados para el dominio del corpus utilizado.
En esa época también se propusieron otras técnicas. Una de ellas basada en modelos de estados finitos, otra en redes neuronales (neural machine translation) simples y una tercera en memorias de traducción (translation memories). Esta última técnica estaba basada en el almacenamiento de un gran número de traducciones y el proceso consistía en buscar la frase almacenada más parecida a la que se quería traducir. En las empresas de servicios de traducción, esta técnica es muy utilizada sola o en combinación con traductores estadísticos o los basados en reglas.
Presente y futuro: las redes neuronales
En la actualidad, una evolución de los modelos basados en redes neuronales constituye lo último en tecnología para la traducción automática. Esta evolución se debió a la aparición de modelos neuronales muy sofisticados en el marco del aprendizaje profundo (deep learning). El éxito de estos modelos también se debió a que era posible acceder a dispositivos con una gran potencia de cálculo y con un coste aceptable.
Todo ello ha permitido que la traducción automática basada en esta tecnología sea utilizada ampliamente con éxito por las industrias de la traducción. Además, este tipo de sistemas está detrás de muchos de los traductores automáticos que se encuentran en páginas web muy conocidas y a los que se pueden acceder de forma gratuita.
Por otra parte, y gracias a la existencia de conjuntos de herramientas de desarrollo abiertas, las empresas pueden construir traductores automáticos de alta calidad con un esfuerzo humano limitado. Esto es posible siempre que se disponga de corpora bilingües suficientemente grandes. Una vez más, este hecho constituye un importante problema en muchas ocasiones, ya que para muchos pares de lenguas no existen tales corpora o son pequeños.
Supervisión humana
En muchos casos, los traductores automáticos basados en redes neuronales generan traducciones de una calidad suficiente. Sin embargo, cuando se requieren traducciones de alta calidad, las empresas suelen utilizar los traductores automáticos para generar frases que, posteriormente, son corregidas y revisadas por traductores humanos. Este proceso es conocido como postedición y tiene un coste muy inferior a la traducción realizada desde un principio por humanos.
Una alternativa a la postedición consiste en hacer colaborar al traductor humano y al automático dentro de un proceso interactivo. En este caso, el humano hace correcciones que el sistema puede aprovechar para generar nuevas y posiblemente mejores traducciones. Esta técnica, conocida como traducción interactiva-predictiva, permite mejorar la productividad gracias a la componente automática y, al mismo tiempo, garantizar la calidad de las traducciones gracias a la intervención humana, pero con un menor esfuerzo.
En estos escenarios interactivos, las nuevas traducciones corregidas pueden utilizarse para mejorar los modelos subyacentes en los traductores automáticos. Para ello se utilizan técnicas de adaptación y concretamente de aprendizaje en línea (online learning).
Otro aspecto interesante es la posibilidad de que el traductor humano utilice otros medios además del teclado y el ratón. Ejemplos de estos medios pueden ser la voz, el lápiz electrónico, pantallas táctiles, imágenes o dispositivos de seguimiento de la mirada. Estos medios complementarios permitirán reducir el esfuerzo humano necesario para generar traducciones de calidad.
La traducción automática hoy y mañana
En resumen, hoy en día la traducción automática de textos es una herramienta útil, ampliamente utilizada tanto por las empresas que dan servicios de traducción como por el público en general. No obstante, hay que ser conscientes de que con muchas aplicaciones no se pueden conseguir traducciones de alta calidad sin asistencia.
El futuro cercano de la traducción parece estar caracterizado por el uso de grandes corpora bilingües y monolingües y de computadores potentes. También es necesario llevar a cabo una investigación de nuevas arquitecturas de redes neuronales y de nuevos algoritmos de aprendizaje. Tampoco hay que olvidar que la traducción del habla (speech translation) puede ser una realidad práctica en un futuro próximo. Actualmente existen algunos sistemas comerciales, pero se requiere más I+D para que realmente sean útiles.
Francisco Casacuberta, Catedrático del Centro de Investigación Pattern Recognition and Human Language Technology, Universitat Politècnica de València
This article is republished from The Conversation under a Creative Commons license. Read the original article.