Tendencias21
Crean un sistema de traducción automática preciso y más fiable

Crean un sistema de traducción automática preciso y más fiable

Un grupo de investigadores europeos están avanzando en el desarrollo de un nuevo sistema informático de traducción que podría ayudar a hacer frente a una de las mayores dificultades con las que se encuentran los intercambios comerciales, la movilidad y el flujo de información: la lengua. Para ello, ha ideado tres tecnologías que, unidas, han dado como resultado un traductor que es entre un 40% y un 60% más preciso que los existentes. Según sus creadores, el traductor automático dista todavía de ser perfecto, pero confían que nuevas investigaciones lo acerquen cada vez más a un traductor humano. Hace poco abrieron el código de todos los componentes desarrollados, que pueden ser descargados libremente. Por Raúl Morales.

Crean un sistema de traducción automática preciso y más fiable

Investigadores europeos, bajo el paraguas del proyecto TC-Star, han conseguido desarrollar un sistema informático de traducción automática más preciso y fiable.

Con 23 lenguas oficiales, las instituciones europeas se gastan cada año 1.000 millones de euros en la traducción de documentos o en la interpretación de discursos. Las empresas europeas se gastan también millones de euros sólo para entenderse y hacer transacciones comerciales con empresas de otros países de la Unión.

Esta situación no tiene parangón en el mundo. El Viejo Continente es el mercado natural para una tecnología automática de traducción. Lo normal, pues, es que este sistema se está desarrollando también dentro de sus fronteras.

“Hay una evidente necesidad de esta tipo de tecnología, no sólo en Europa sino en otras partes del mundo… ahorra tiempo y dinero”, comenta Marcello Federico, investigador de la empresa italiana FBK-irst, que participa en este proyecto, en declaraciones a ICT Results.

Pocos resultados

Hasta ahora, nadie ha conseguido desarrollar un sistema de traducción automático que acerque a cualquiera la capacidad humana de traducir e interpretar. Los traductores que se encuentran en Internet son imprecisos, puntúan mal, desplazan palabras y comenten errores gramaticales. Todo ello hace que la traducción sea, en muchas ocasiones, casi ininteligible. Otros sistemas pueden únicamente traducir ciertas palabras o frases predeterminadas, sólo lo suficiente para que un turista pueda hacer la reserve de un hotel o consultar los horarios de un vuelo.

Ello, pese a los esfuerzos que han hecho multinacionales como Yahoo, Google o IBM que han investigado y apostado por sistemas de traducción con el fin de que la explosión de difusión de contenidos en el mundo entero llegue a más gente.

Pero hay más cosas en juego. El DARPA (Defense Advanced Research Projects Agency), destina cada año 50 millones de dólares al año a «tecnologías del lenguaje» para facilitar las comunicaciones inmediatas con los aliados sobre el campo de batalla y para poder tener una aproximación más clara sobre lo que se mueve en Internet.

Federico lidera un equipo de investigación que tiene una visión de la traducción un poco más ambiciosa. El desarrollo de esta tecnología se enmarca en el proyecto TC-STAR, financiado por la UE, cuya finalidad es sortear uno de los retos tecnológicos relacionados con el lenguaje humano más importantes: hablar en una lengua y pasar esas mismas palabras a otra sin que se pierda información por el camino.

“Para los humanos, la traducción es una tarea complicada por naturaleza. Normalmente, no manejamos igual las dos lenguas implicadas. El trabajo para una máquina de traducción es todavía más complicado”, comenta Federico. “TC-STAR ha sido el primer proyecto en el mundo que trata de desarrollar una traducción conversación-conversación sin restricciones”.

Para que un sistema así sea capaz de traducir cualquier discurso sin importar el tema o el contexto se han utilizado tres tecnologías, que distan todavía de ser perfectas. El Reconocedor Automático del Discurso se usa para transcribir la palabra hablada a texto. El Traductor de Lengua Hablada traduce la lengua de origen a la lengua de destino. La última herramienta informática creada por este grupo de investigadores es el Texto a Conversación, que sintetiza el resultado hablado.

Los socios de TC-STAR han desarrollado componentes para manejar cada una de estas tareas, creando una plataforma que ha llevado el “estado del arte” de la tecnología de traducción a un estadio cercano a lo conseguido por los traductores humanos.

Una de las innovaciones clave ha sido combinar algunos sistemas del Reconocedor Automático del Discursos con los del Traductor de Lengua Hablada para hacer las fases de la trascripción y la traducción considerablemente más aproximadas que otros sistemas parecidos.

Importante mejora

Basadas en el método BLEU (Bilingual Evaluation Understudy), un modo de comparar las traducciones humanas y las hechas por una máquina, las evaluaciones hechas sobre la calidad de las traducciones han puesto de manifiesto que esta nueva tecnología las mejora entre un 40% y un 60%, mientras que el 70% de todas las palabras fueron traducidas correctamente, incluso si éstas estaban incorrectamente colocadas en la frase.

Los 11 socios que han participado en el proyecto, entre los que están grandes empresas de telecomunicaciones y de entretenimiento, como Nokia, Siemens, IBM o Sony, trabajaron con grabaciones de discursos del Parlamento Europeo que ha traducido del inglés al español. Asimismo, trabajaron con emisiones de radio que tradujeron del chino al inglés.

Aunque el sistema todavía no ha alcanzado la precisión de los traductores e interpretes profesionales, Federico está convencido de que con más investigación se podría alcanzar una versión comercializable en unos años.

Mientras tanto, los componentes desarrollados bajo el paraguas de TC-STAR se han puesto al alcance de todos y los han hecho “open source”, pudiéndose descargar libremente desde la página de TC-STAR. Además, el proyecto ha derivado en la creación de una empresa (CalledPerVoice) que ya ofrece servicios de traducción automática remota para empresas y estamentos públicos.

Hacer un comentario

RSS Lo último de Tendencias21

  • La IA podría ser el límite para todas las civilizaciones avanzadas en el Universo 10 abril, 2024
    Un nuevo estudio sugiere que el desarrollo de la Inteligencia Artificial (IA) hacia una Superinteligencia Artificial (ASI) podría explicar por qué no hemos detectado aún otras civilizaciones avanzadas en el cosmos, a pesar de la alta probabilidad de su existencia: en vez de supernovas, plagas, guerras nucleares o eventos climáticos extremos que hayan sido un […]
    Pablo Javier Piacente
  • Higgs ha podido dejar abierta la puerta a la Nueva Física 10 abril, 2024
    La muerte de Peter Higgs, que pasará a la historia como el descubridor del bosón que explica cómo se forma la materia, deja un legado en la historia de la física que todavía puede aportar algo más trascendente: la prueba definitiva de una Nueva Física más allá del Modelo Estándar.
    Eduardo Martínez de la Fe
  • Descubren neuronas "zombis" en el cerebro, que serían claves en el proceso de aprendizaje 9 abril, 2024
    Las neuronas "zombis" son unidades vivas pero funcionalmente alteradas, que parecen "dormidas" en determinadas situaciones: los investigadores han revelado que cumplen un papel fundamental en el cerebelo, concretamente en aspectos relativos a la forma en la cual aprendemos.
    Pablo Javier Piacente
  • La Luna se invirtió por completo hace más de 4 mil millones de años 9 abril, 2024
    Hace unos 4.220 millones de años, poco después de que la Luna se formara a partir de un trozo de la Tierra que se desprendió durante una colisión violenta a principios de la historia del Sistema Solar, nuestro satélite se dio vuelta y comenzó así una etapa clave de su desarrollo. Así lo ha comprobado […]
    Pablo Javier Piacente
  • Arte rupestre de hace 2.000 años podría representar música psicodélica 9 abril, 2024
    Aunque la música psicodélica moderna no nació hasta la década de 1960, las influencias psicodélicas se pueden encontrar en el arte rupestre de hace miles de años. Grabados precolombinos en piedra, de 2.000 años de antigüedad, reflejan figuras humanas bailando en estado de trance chamánico.
    Redacción T21
  • Descubren antiguas partículas de polvo espacial provenientes de otro sistema estelar 8 abril, 2024
    Los astrónomos han descubierto una rara partícula de polvo atrapada en un antiguo meteorito extraterrestre, que fue formado por una estrella distinta a nuestro Sol. El polvo se habría originado luego de una supernova: las partículas son como "cápsulas del tiempo celestes" y proporcionan una instantánea de la vida de su estrella madre.
    Pablo Javier Piacente
  • Un lejano mundo deja ver una increíble explosión de luz en sus cielos "metálicos" 8 abril, 2024
    Utilizando datos del Telescopio Espacial CHEOPS de la Agencia Espacial Europea (ESA), cuyo centro de operaciones científicas se localiza en la Universidad de Ginebra, en Suiza, un equipo internacional de científicos logró detectar por primera vez un extraño fenómeno lumínico denominado “gloria” en un exoplaneta: el estallido de luz se apreció en WASP-76b, un mundo […]
    Pablo Javier Piacente
  • El ordenador cuántico desembarca en el mundo universitario 8 abril, 2024
    La última computadora cuántica System One de IBM se ha instalado en el Instituto Politécnico Rensselaer (RPI) en Nueva York. Es la primera máquina cuántica de IBM instalada en un campus universitario de Estados Unidos. Una revolución en el mundo académico que impulsa la formación de un ecosistema cuántico global.
    Eduardo Martínez de la Fe
  • Los cocodrilos imitan a las ballenas antes de aparearse 7 abril, 2024
    Los cocodrilos cortejan a las hembras lanzando un chorro de agua al aire, tal como hacen las ballenas cuando salen a la superficie. A ellas les encantan también los silbidos y las burbujas que les dedican sus parejas antes de aparearse. Se está elaborando un diccionario de cocodrilos.
    Redacción T21
  • Los drones policiales se implantan en Estados Unidos 6 abril, 2024
    Chula Vista, un suburbio de San Diego, California, con una población de 275.000 habitantes, es una de las pocas ciudades estadounidenses que utiliza sistemáticamente drones para ayudar a la policía en caso de emergencia. En activo desde 2018, el sistema está sirviendo de referencia a otros Estados y tal vez otros países.
    Redacción T21