Tendencias21

Usan la Biblia y Wikipedia para desarrollar tecnologías para idiomas minoritarios

Apple’s Siri, el traductor de Google y otras tecnologías para lenguajes han permanecido reservadas durante mucho tiempo para los hablantes del inglés u otras lenguas mayoritarias. Esto podría cambiar porque lingüistas de la Universidad de Copenhague (Dinamarca) han producido tecnología del lenguaje que funciona, al mismo tiempo, para 100 idiomas minoritarios y grandes. Para su desarrollo, se han basado en dos fuentes muy diferentes: versículos bíblicos y artículos de Wikipedia.

Usan la Biblia y Wikipedia para desarrollar tecnologías para idiomas minoritarios

Apple’s Siri, el traductor de Google y otras tecnologías para lenguajes han permanecido reservadas durante mucho tiempo para los hablantes del inglés u otras lenguas mayoritarias. Las personas que hablen galés o gallego, por ejemplo, no podían usarlas en su propio idioma.

Esto podría cambiar porque lingüistas de la Universidad de Copenhague (Dinamarca) han producido tecnología del lenguaje que funciona, al mismo tiempo, para 100 idiomas minoritarios y grandes. Para su desarrollo, se han basado en dos fuentes muy diferentes: versículos bíblicos y artículos de Wikipedia, la gran enciclopedia online.

“Cuando desarrollamos sistemas de traducción automática y motores de búsqueda, por lo general introducimos en la computadora grandes cantidades de textos que contienen información sobre la función y el significado de las palabras. Por razones históricas, estos textos han sido principalmente artículos de periódicos en inglés y otras grandes lenguas. No tenemos acceso a textos similares en lenguas más pequeñas como la de las Islas Feroe, el galés, el gallego y el irlandés, o incluso una lengua africana importante como yoruba, que es hablada por 28 millones de personas”, dice el profesor Anders Søgaard, de la Universidad de Copenhague, en la nota de prensa de ésta.

Anders Søgaard y sus colegas apostaron por buscar textos que hubieran sido traducidos a muchos idiomas, de modo que pudiera transmitirse el conocimiento sobre la gramática de las lenguas grandes al de las pequeñas.

“La Biblia ha sido traducida a más de 1.500 idiomas, incluso la mayoría de los más exóticos y pequeños, y las traducciones son extremadamente conservadoras; los versos tienen una estructura completamente uniforme en los diferentes idiomas, lo que significa que podemos hacer modelos informáticos adecuados incluso para lenguas muy pequeñas, con sólo doscientas páginas de texto bíblico”, explica Søgaard.

Desarrollo de recursos lingüísticos

La enciclopedia en línea hecha por usuarios Wikipedia también ha demostrado ser una fuente muy útil para los investigadores, que utilizan sus textos para desarrollar recursos lingüísticos.
 
Wikipedia contiene más de 35 millones de artículos, pero es el hecho de que por lo menos 129 idiomas estén representados – con más de 10.000 artículos de cada uno- el que hace que los investigadores la encuentren interesante, puesto que muchos artículos se refieren a los mismos conceptos y temas.

“Esto nos permite hacer lo que llamamos “indexación invertida”, lo que significa que se utiliza el concepto que los artículos tratan de describir para describir precisamente las palabras usadas para describirlo”, explica Søgaard.
 
“Si aparece la palabra gafas en la entrada de la Wikipedia sobre Harry Potter, y la palabra alemana Brille se utiliza en la entrada alemana equivalente, es muy probable que las dos palabras se representen de forma similar en nuestros modelos de sistemas de traducción automática. Y la ventaja de este modelo es que puede ser aplicado a 100 idiomas diferentes al mismo tiempo, incluyendo a muchos idiomas a los que previamente se les han negado los recursos de tecnología que usamos todos los días”.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • ¿Fue la Edad del Hierro un período histórico matriarcal? 23 enero, 2025
    Genetistas y arqueólogos han descubierto a través del análisis de ADN antiguo evidencia convincente que sugiere que la Edad del Hierro de Gran Bretaña puede haber sido aún más matriarcal de aquello que se pensaba anteriormente: las tierras se transmitían a la descendencia femenina, por ejemplo, siendo la primera vez que se documenta este tipo […]
    Redacción T21
  • Un enorme objeto interestelar modificó para siempre a nuestro Sistema Solar 22 enero, 2025
    Un estudio sugiere que es posible que un objeto de origen interestelar de enorme tamaño y peso se introdujera en el Sistema Solar al principio de su formación, dejando una huella imborrable en las órbitas planetarias, antes de desviarse nuevamente hacia otros confines del Universo. El visitante fugaz podría haber tenido características similares al misterioso […]
    Pablo Javier Piacente / T21
  • Cada vez más cerca de la energía limpia e ilimitada: el “Sol artificial” de China rompe un nuevo récord 22 enero, 2025
    La posibilidad de disfrutar de una fuente energética limpia e inagotable está más cerca de ser una realidad, luego que este lunes 20 de enero el Experimental Advanced Superconducting Tokamak (EAST), el reactor de fusión experimental conocido como el “Sol artificial” chino, rompiera un nuevo récord de producción de plasma: superó en más del doble […]
    Pablo Javier Piacente / T21
  • La costumbre de orinar en grupos provendría de los monos 22 enero, 2025
    Las personas generalmente van al baño en grupos: según una nueva investigación, los chimpancés hacen lo mismo, posiblemente para fortalecer los lazos sociales. Es posible que la tendencia en los seres humanos hacia la "micción contagiosa" sea una herencia evolutiva proveniente de otros primates.
    Redacción T21
  • Descubren antiguos sacrificios para hacer "renacer" al Sol después de una enorme erupción volcánica 21 enero, 2025
    Cientos de artefactos de piedra descubiertos en la isla danesa de Bornholm pueden haber sido ofrecidos a los dioses para evitar una crisis climática: se entregaron a modo de sacrificio hace casi 5.000 años, para lograr el "regreso" de un Sol oscurecido luego de una gigantesca erupción volcánica. Los investigadores creen que todo el hemisferio […]
    Pablo Javier Piacente / T21
  • El cambio climático está "atrapando" a algunas bacterias en un bucle temporal eterno 21 enero, 2025
    Especies de bacterias en un lago de Wisconsin están en una suerte de "bucle interminable" evolutivo: han crecido rápidamente y regresado abruptamente a su estado inicial, repitiendo una y otra vez ese ciclo, aparentemente en respuesta a estaciones y otros parámetros ambientales que cambiaron drásticamente como consecuencia del cambio climático.
    Pablo Javier Piacente / T21
  • Tendremos un futuro utópico y distópico a la vez 21 enero, 2025
    La nueva edición de la exposición ArtFutura, que se desarrolla en el Palacio Neptuno de Madrid, transmite un mensaje claro: la Inteligencia Artificial Generativa no es una amenaza para el arte, sino una nueva herramienta que expande los límites de nuestra creatividad. Sin miedo.
    Alejandro Sacristán (enviado especial T21)
  • Una interfaz cerebro-ordenador permite a una persona con parálisis operar un helicóptero virtual 21 enero, 2025
    La interfaz cerebro-ordenador puede permitir a las personas con parálisis interactuar con otros, participar en trabajos remotos y disfrutar de actividades recreativas: un implante colocado quirúrgicamente en una persona con parálisis en las cuatro extremidades proporcionó un nivel de control sin precedentes sobre un cuadricóptero virtual, solo pensando en el movimiento de los dedos para […]
    Redacción T21
  • Una abeja robótica rompe los récords de polinización y hace acrobacias en el aire 20 enero, 2025
    Un insecto-robot que simula a una abeja y pesa menos de un gramo, aletea con la misma eficacia que los insectos en la naturaleza y fue diseñado para la polinización artificial: podría sentar las bases para una producción agrícola realizada totalmente es espacios interiores. El avance permitiría cultivar frutas y verduras dentro de un almacén […]
    Pablo Javier Piacente / T21
  • Nuevos hallazgos reafirman el origen genético de la depresión 20 enero, 2025
    Un nuevo estudio señala los "genes de la depresión" en todas las etnias: se trata de 239 factores de riesgo genéticos para la depresión que inciden en todas las principales poblaciones mundiales. Esto permitirá a los científicos predecir por primera vez el riesgo de depresión independientemente del origen étnico de cada persona.
    Pablo Javier Piacente / T21