Tendencias21
Un sistema informático descifra la antigua lengua ugarítica

Un sistema informático descifra la antigua lengua ugarítica

Investigadores norteamericanos han diseñando un sistema capaz de descifrar una de las lenguas fenicias más antiguas en tan sólo un par de horas. El software parte de la base de que todo lenguaje está estrechamente relacionado con algún otro idioma. A partir de esas correlaciones genera mapas alfabéticos y traducciones de palabras utilizando técnicas clásicas de inteligencia artificial. Por Elena Higueras

Un sistema informático descifra la antigua lengua ugarítica

Un equipo de investigación formado por Regina Barzilay, profesora asociada del Laboratorio de Informática e Inteligencia artificial del MIT, Ben Snyder, estudiante de posgrado en su laboratorio y Kevin Knight, alumno de la Universidad del Sur de California, ha desarrollado un nuevo sistema informático que, en cuestión de horas, consigue descifrar gran parte de la antigua lengua semítica ugarítica. Según un comunicado publicado en el MIT, el trabajo del equipo norteamericano no sólo ayudará a los arqueólogos a descifrar las lenguas más antiguas del mundo, sino que además podría ampliar el número de lenguas que los sistemas de traducción automática como Google Translate puede manejar.

El centro de la investigación es la ugarítica, una lengua que pertenece a la familia semítica (parte de la macrofamilia de lenguas afroasiáticas que se desarrollaron sobre todo por Oriente Próximo y el norte y este de África). Fue la lengua de Ugarit, un centro comercial en la costa mediterránea de Siria con una extensión aproximada de 2.000 kilómetros cuadrados. Se trata de la única lengua bien atestiguada de todas las nativas de la franja fenicia en el segundo milenio a. C.

Su escritura, cuneiforme consonántica, ya ha sido descifrada, por lo que el sistema americano ha podido comprobar el rendimiento de su programa. De las 30 letras que conforman el alfabeto ugarítico, el software ha asignado correctamente 29 de ellas a sus homólogas hebreas. Pero además, de un tercio de las palabras en hebreo que tienen cognados ugaríticos (aquellos términos con un mismo origen etimológico, pero con distinta evolución fonética) el sistema ha identificado correctamente el 60%. «De los que son incorrectos, a menudo lo son sólo por una sola letra, por lo que sirven como muy buenas conjeturas», apunta Snyder. Pero ¿cómo se ha llegado a este nivel de exactitud?

Similitud entre lenguas

La investigación parte de tres supuestos: el primero es que toda lengua está íntimamente relacionada con otra (en el caso de la ugarítica, los científicos eligieron el hebreo); el segundo es que hay una manera sistemática para asignar el alfabeto de un idioma al alfabeto de otro; y el tercero asume que existe una correlación estructural (número de partes) en las palabras compuestas de los idiomas comparados.

En el plano de la palabra, el software parte de un supuesto similar: los dos idiomas relacionados deben tener al menos algunos cognados o palabras con raíces comunes, como “main” y mano en francés y español, o “homme” y hombre. Y, por último, el sistema supone una asignación similar para partes de palabras. Por ejemplo, un término como “sobrecarga”, tiene un prefijo “sobre” y un sufijo “carga”. El sistema podría anticipar que otras palabras en la lengua contarán con ese prefijo y sufijo y que el cognado de la palabra “sobrecarga” existirá en otro idioma, como sucede con “surchargeant” en francés.

Sobre estas premisas el sistema construye mapas de símbolos que se repiten con frecuencia en un idioma y lo compara con los mapas de símbolos de otra lengua. A partir de ahí, modelos estadísticos comunes en las investigaciones de Inteligencia Artificial determinan cuál de las asignaciones parece haber identificado un conjunto coherente de sufijos y prefijos.

A continuación, el sistema podría buscar las correspondencias en el plano de la palabra, lo que, a su vez, podría ayudar a refinar aún más el mapa alfabético. Esto supone un trabajo de revisión continua, como admite uno de sus creadores, Ben Snyder: “Tenemos que recorrer los datos miles de veces, y cada vez, nuestras conjeturas tendrán mayor probabilidad, porque en realidad estamos acercándonos a una solución con la que conseguimos más coherencia. Finalmente, el sistema llega a un punto en el que alterar sus asignaciones no implica mejorar la consistencia”.

A pesar de los buenos resultados obtenidos, los padres del invento no pretenden eliminar la figura humana del traductor, ya que, reconocen que su sistema no utiliza actualmente toda la información de contexto para resolver ambigüedades. Por ejemplo, las palabras ugarítica de “casa” e “hija” se escriben de la misma manera, pero sus contrapartes hebreas no lo hacen. Aunque el programa de vez en cuando pueda mezclarlas, una persona podría fácilmente decidir cuál es la correcta dependiendo del contexto.

Voces disonantes

Sin embargo, no todo el mundo comparte el optimismo del equipo norteamericano. Andrew Robinson, que fue editor literario del suplemento de educación superior del diario Times en 2002, ya advertía entonces (con su libro Lost Languages) que «el éxito de los desciframientos arqueológicos requería una síntesis de la lógica y la intuición que los ordenadores no poseen”. Ocho años después, y con esta investigación sobre la mesa, Robinson sigue siendo escéptico. Opina que el nuevo sistema supone que está claro dónde termina un carácter o palabra y empieza otra, lo que no sucede en muchas lenguas con alfabetos ya descifrados.

Ante este argumento, Regina Barzilay contesta que probablemente el sistema requerirá adaptarlo a las características de cada lengua, y añade que «el desciframiento de la lengua ugarítica se basó en algunas coincidencias felices, como el descubrimiento de un hacha en la que estaba tallada la palabra «hacha» en ugarítico”.

De hecho, Snyder y Barzilay no creen que su sistema pueda nunca sustituir a los descifradores humanos, pero sí lo consideran como un instrumento poderoso que puede ayudarlos. Además, una variante del modelo podría ampliar la versatilidad de los software de traducción automática como Google Translate, que en la actualidad sólo opera con 57 idiomas. El equipo norteamericano presentará su trabajo en la Reunión Anual de la Asociación de Lingüística Computacional que se celebrará en Suecia del 11 al 16 de julio.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • La IA podría ser el límite para todas las civilizaciones avanzadas en el Universo 10 abril, 2024
    Un nuevo estudio sugiere que el desarrollo de la Inteligencia Artificial (IA) hacia una Superinteligencia Artificial (ASI) podría explicar por qué no hemos detectado aún otras civilizaciones avanzadas en el cosmos, a pesar de la alta probabilidad de su existencia: en vez de supernovas, plagas, guerras nucleares o eventos climáticos extremos que hayan sido un […]
    Pablo Javier Piacente
  • Higgs ha podido dejar abierta la puerta a la Nueva Física 10 abril, 2024
    La muerte de Peter Higgs, que pasará a la historia como el descubridor del bosón que explica cómo se forma la materia, deja un legado en la historia de la física que todavía puede aportar algo más trascendente: la prueba definitiva de una Nueva Física más allá del Modelo Estándar.
    Eduardo Martínez de la Fe
  • Descubren neuronas "zombis" en el cerebro, que serían claves en el proceso de aprendizaje 9 abril, 2024
    Las neuronas "zombis" son unidades vivas pero funcionalmente alteradas, que parecen "dormidas" en determinadas situaciones: los investigadores han revelado que cumplen un papel fundamental en el cerebelo, concretamente en aspectos relativos a la forma en la cual aprendemos.
    Pablo Javier Piacente
  • La Luna se invirtió por completo hace más de 4 mil millones de años 9 abril, 2024
    Hace unos 4.220 millones de años, poco después de que la Luna se formara a partir de un trozo de la Tierra que se desprendió durante una colisión violenta a principios de la historia del Sistema Solar, nuestro satélite se dio vuelta y comenzó así una etapa clave de su desarrollo. Así lo ha comprobado […]
    Pablo Javier Piacente
  • Arte rupestre de hace 2.000 años podría representar música psicodélica 9 abril, 2024
    Aunque la música psicodélica moderna no nació hasta la década de 1960, las influencias psicodélicas se pueden encontrar en el arte rupestre de hace miles de años. Grabados precolombinos en piedra, de 2.000 años de antigüedad, reflejan figuras humanas bailando en estado de trance chamánico.
    Redacción T21
  • Descubren antiguas partículas de polvo espacial provenientes de otro sistema estelar 8 abril, 2024
    Los astrónomos han descubierto una rara partícula de polvo atrapada en un antiguo meteorito extraterrestre, que fue formado por una estrella distinta a nuestro Sol. El polvo se habría originado luego de una supernova: las partículas son como "cápsulas del tiempo celestes" y proporcionan una instantánea de la vida de su estrella madre.
    Pablo Javier Piacente
  • Un lejano mundo deja ver una increíble explosión de luz en sus cielos "metálicos" 8 abril, 2024
    Utilizando datos del Telescopio Espacial CHEOPS de la Agencia Espacial Europea (ESA), cuyo centro de operaciones científicas se localiza en la Universidad de Ginebra, en Suiza, un equipo internacional de científicos logró detectar por primera vez un extraño fenómeno lumínico denominado “gloria” en un exoplaneta: el estallido de luz se apreció en WASP-76b, un mundo […]
    Pablo Javier Piacente
  • El ordenador cuántico desembarca en el mundo universitario 8 abril, 2024
    La última computadora cuántica System One de IBM se ha instalado en el Instituto Politécnico Rensselaer (RPI) en Nueva York. Es la primera máquina cuántica de IBM instalada en un campus universitario de Estados Unidos. Una revolución en el mundo académico que impulsa la formación de un ecosistema cuántico global.
    Eduardo Martínez de la Fe
  • Los cocodrilos imitan a las ballenas antes de aparearse 7 abril, 2024
    Los cocodrilos cortejan a las hembras lanzando un chorro de agua al aire, tal como hacen las ballenas cuando salen a la superficie. A ellas les encantan también los silbidos y las burbujas que les dedican sus parejas antes de aparearse. Se está elaborando un diccionario de cocodrilos.
    Redacción T21
  • Los drones policiales se implantan en Estados Unidos 6 abril, 2024
    Chula Vista, un suburbio de San Diego, California, con una población de 275.000 habitantes, es una de las pocas ciudades estadounidenses que utiliza sistemáticamente drones para ayudar a la policía en caso de emergencia. En activo desde 2018, el sistema está sirviendo de referencia a otros Estados y tal vez otros países.
    Redacción T21