Tendencias21

Usan la Biblia y Wikipedia para desarrollar tecnologías para idiomas minoritarios

Apple’s Siri, el traductor de Google y otras tecnologías para lenguajes han permanecido reservadas durante mucho tiempo para los hablantes del inglés u otras lenguas mayoritarias. Esto podría cambiar porque lingüistas de la Universidad de Copenhague (Dinamarca) han producido tecnología del lenguaje que funciona, al mismo tiempo, para 100 idiomas minoritarios y grandes. Para su desarrollo, se han basado en dos fuentes muy diferentes: versículos bíblicos y artículos de Wikipedia.

Usan la Biblia y Wikipedia para desarrollar tecnologías para idiomas minoritarios

Apple’s Siri, el traductor de Google y otras tecnologías para lenguajes han permanecido reservadas durante mucho tiempo para los hablantes del inglés u otras lenguas mayoritarias. Las personas que hablen galés o gallego, por ejemplo, no podían usarlas en su propio idioma.

Esto podría cambiar porque lingüistas de la Universidad de Copenhague (Dinamarca) han producido tecnología del lenguaje que funciona, al mismo tiempo, para 100 idiomas minoritarios y grandes. Para su desarrollo, se han basado en dos fuentes muy diferentes: versículos bíblicos y artículos de Wikipedia, la gran enciclopedia online.

“Cuando desarrollamos sistemas de traducción automática y motores de búsqueda, por lo general introducimos en la computadora grandes cantidades de textos que contienen información sobre la función y el significado de las palabras. Por razones históricas, estos textos han sido principalmente artículos de periódicos en inglés y otras grandes lenguas. No tenemos acceso a textos similares en lenguas más pequeñas como la de las Islas Feroe, el galés, el gallego y el irlandés, o incluso una lengua africana importante como yoruba, que es hablada por 28 millones de personas”, dice el profesor Anders Søgaard, de la Universidad de Copenhague, en la nota de prensa de ésta.

Anders Søgaard y sus colegas apostaron por buscar textos que hubieran sido traducidos a muchos idiomas, de modo que pudiera transmitirse el conocimiento sobre la gramática de las lenguas grandes al de las pequeñas.

“La Biblia ha sido traducida a más de 1.500 idiomas, incluso la mayoría de los más exóticos y pequeños, y las traducciones son extremadamente conservadoras; los versos tienen una estructura completamente uniforme en los diferentes idiomas, lo que significa que podemos hacer modelos informáticos adecuados incluso para lenguas muy pequeñas, con sólo doscientas páginas de texto bíblico”, explica Søgaard.

Desarrollo de recursos lingüísticos

La enciclopedia en línea hecha por usuarios Wikipedia también ha demostrado ser una fuente muy útil para los investigadores, que utilizan sus textos para desarrollar recursos lingüísticos.
 
Wikipedia contiene más de 35 millones de artículos, pero es el hecho de que por lo menos 129 idiomas estén representados – con más de 10.000 artículos de cada uno- el que hace que los investigadores la encuentren interesante, puesto que muchos artículos se refieren a los mismos conceptos y temas.

“Esto nos permite hacer lo que llamamos “indexación invertida”, lo que significa que se utiliza el concepto que los artículos tratan de describir para describir precisamente las palabras usadas para describirlo”, explica Søgaard.
 
“Si aparece la palabra gafas en la entrada de la Wikipedia sobre Harry Potter, y la palabra alemana Brille se utiliza en la entrada alemana equivalente, es muy probable que las dos palabras se representen de forma similar en nuestros modelos de sistemas de traducción automática. Y la ventaja de este modelo es que puede ser aplicado a 100 idiomas diferentes al mismo tiempo, incluyendo a muchos idiomas a los que previamente se les han negado los recursos de tecnología que usamos todos los días”.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Los astrónomos observan un misterioso glóbulo cometario vagando por el cosmos 27 marzo, 2024
    Utilizando el Telescopio de rastreo VLT (VST) los científicos han producido una imagen impactante de GN 16.43.7.01, un glóbulo cometario situado a 5.000 años luz de distancia de la Tierra, en la constelación de Escorpio. Se trata de pequeñas y débiles nubes interestelares de gas y polvo cósmico, con una forma similar a la de […]
    Pablo Javier Piacente
  • Sería inminente el hallazgo de vida extraterrestre en Europa, una de las lunas de Júpiter 27 marzo, 2024
    Basado en experimentos recientes, un grupo de científicos determinó en un nuevo estudio que un instrumento en particular a bordo de la futura misión Europa Clipper de la NASA, denominado SUrface Dust Analyzer, era tan sensible que probablemente podría detectar signos de vida extraterrestre en granos individuales de hielo expulsados por Europa, la luna helada […]
    Pablo Javier Piacente
  • ¿La criopreservación es el paso necesario para la resurrección moderna? 27 marzo, 2024
    En España hay cinco casos de personas sometidas a criopreservación después de fallecer, a la espera de que la tecnología permita, tal vez, volverlos a la vida en los años 50 de este siglo.
    José Luis Cordeiro (*)
  • Crean un cerebro fantasma en forma de cubo impreso en 3D 27 marzo, 2024
    Investigadores austriacos han desarrollado un modelo de cerebro impreso en 3D basado en la estructura de las fibras cerebrales visibles mediante imágenes de resonancia magnética. Permite estudiar la compleja red neuronal con una precisión sin precedentes.
    Redacción T21
  • El océano se está desgarrando 26 marzo, 2024
    2.000 terremotos en un día en Canadá insinúan el nacimiento de una nueva corteza oceánica frente a la costa de la isla de Vancouver: está a punto de nacer a través de una ruptura magmática en las profundidades del mar.
    Pablo Javier Piacente
  • Simulan una explosión termonuclear en un superordenador 26 marzo, 2024
    Una simulación por superordenador nos brinda nuevos conocimientos sobre el comportamiento de las estrellas de neutrones: al evocar la explosión termonuclear que tiene lugar cuando estos monstruos cósmicos devoran a otra estrella, los investigadores logran avanzar en la comprensión de los fenómenos más extremos que suceden en el cosmos.
    Pablo Javier Piacente
  • Las matemáticas tienen la clave para erradicar el machismo 26 marzo, 2024
    Las matemáticas demuestran que si una parte significativa de las mujeres de una población (superando el límite del 45%) se comporta solidariamente con otras mujeres (como si fuesen hermanas), el machismo se extingue.
    Alicia Domínguez y Eduardo Costas (*)
  • El cerebro nos invita a soñar despiertos y luego nos rescata del ensueño 26 marzo, 2024
    El cerebro dispone de un doble mecanismo que, por un lado, nos inspira la creatividad provocando que soñemos despiertos, y por otro, nos devuelve a la realidad para sacarnos de la divagación inútil.
    Redacción T21
  • Las ondas cerebrales se mueven en direcciones opuestas para crear recuerdos y luego para recuperarlos 25 marzo, 2024
    Los científicos descubrieron que las ondas cerebrales tendían a moverse desde la parte posterior del cerebro hacia el frente mientras las personas guardaban algo en su memoria. Por el contrario, cuando buscaban recordar la misma información, esas ondas se movían en la dirección opuesta, desde el frente hacia la parte posterior del cerebro.
    Pablo Javier Piacente
  • Descubren una de las estrellas más antiguas del Universo muy cerca de la Vía Láctea 25 marzo, 2024
    La estrella LMC 119 fue apreciada en la Gran Nube de Magallanes, muy cerca de la Vía Láctea, y es la primera estrella de la segunda generación de formación estelar del Universo que se ha identificado en otra galaxia. Esta estrella, una de las más antiguas en el cosmos descubiertas hasta hoy, proporciona una ventana […]
    Pablo Javier Piacente