Tendencias21
Microsoft desarrolla ordenadores que analizan, comprenden y completan frases

Microsoft desarrolla ordenadores que analizan, comprenden y completan frases

La división científica de Microsoft lidera un equipo de investigación interesado en demostrar la capacidad de los ordenadores para entender la complejidad semántica del lenguaje. Para ello han ideado una serie de algoritmos de aprendizaje automático capaces de analizar y comprender las frases que se les presentan, e incluso completarlas con la palabra más apropiada para que tengan sentido completo. De momento la tasa de éxito supera levemente el 50%, pero se obtienen mejores resultados que dejándolo al azar. Por Patricia Pérez.

Microsoft desarrolla ordenadores que analizan, comprenden y completan frases

El detective más famoso de la literatura, Sherlock Holmes, sobresalía por su inteligencia, por su capacidad de observación y de deducción, suficiente como para terminar las frases de su querido compañero Watson antes de que el buen doctor tuviera la oportunidad de hacerlo.

Pero, ¿podrían los ordenadores actuar con la misma astucia de Holmes y deducir lo que se va a decir antes de hacerlo?

Un equipo de científicos de la computación de Microsoft Research (MSR), división de la multinacional informática dedicada a la investigación de la ciencia de equipo, en Redmond, junto a compañeros de la Universidad de Cornell y la Universidad de California en Irvine (UCI), ambas en Estados Unidos, están tratando de averiguarlo con interesantes resultados, según publica la web V3.co.uk.

Los investigadores tenían curiosidad por estudiar la capacidad que se presupone a los ordenadores para entender la complejidad semántica del lenguaje. Para ello idearon una serie de algoritmos de aprendizaje automático, con el objetivo de que pudieran analizar y comprender los enunciados que se les presentaran.

Después se dedicaron a ponerlos a prueba con las más variopintas fuentes de datos, desde los más complejos exámenes a populares artículos periodísticos o publicados en la red. Según la procedencia de los datos, los resultados variaron y, con ello, el nivel de éxito del método.

Coherencia semántica

Como explican los investigadores en su artículo de presentación, en este trabajo se pone a prueba la capacidad de los algoritmos para distinguir el sentido del sinsentido en una frase.

Para ello, se aborda el problema con dos enfoques: métodos que utilizan puramente información léxica, como los n-gramas de un modelo de lenguaje clásico -aquellos que permiten hacer una predicción estadística del próximo elemento de la secuencia- y métodos que evalúan la coherencia global, que necesitan un análisis semántico.

Para cada enfoque, los algoritmos se entrenaron con diferentes test de comprensión, incluyendo preguntas de exámenes propias de Secundaria y pruebas basadas en pasajes de las cinco novelas de Sherlock Holmes escritas por Sir Arthur Conan Doyle.

Sobresale la Prueba de Aptitud Académica (SAT, por sus siglas en inglés), basada en frases con uno o dos espacios en blanco para rellenar, con cinco palabras como opción para cada caso. Sólo una de ellas no guarda coherencia semántica.

Estas pruebas están muy limitadas, en el sentido de que toda la información necesaria está presente en la propia sentencia. «Son cuestiones interesantes porque sondean la capacidad de distinguir entre oraciones semánticamente coherentes de las incoherentes, y sin necesidad de más contexto que la propia frase», señalan los investigadores. Sin embargo, varían en dificultad. En general, las preguntas requieren una combinación de conocimiento general y semántico, así como un ocasional razonamiento lógico.

Los algoritmos utilizan la técnica estadística conocida como estimación de frecuencia Good-Turing, basada en los trabajos del precursor de la informática moderna, el británico Alan Turing, durante su colaboración en la Segunda Guerra Mundial para descifrar los mensajes cifrados alemanes.

Tras entrenar a los algoritmos con un amplio corpus de palabras, estos son capaces de predecir la probabilidad de que una de las opciones tenga mayor sentido para rellenar el espacio en blanco. Para ello previamente deben calcular la probabilidad de sentido de la frase con cada una de las opciones posibles.

Microsoft desarrolla ordenadores que analizan, comprenden y completan frases

Éxito parcial

La fuente de datos se extrajo por una parte del archivo de todo el material publicado por el diario Los Angeles Times entre 1985 y 2002, lo que se traduce en alrededor de 1,1 millones de palabras en total. A ello se suman frases extraídas de la versión de 2003 de la enciclopedia multimedia Encarta, así como de la colección de artículos publicados en la enciclopedia de contenido libre Wikipedia.

Cuando se enfrentaron a los exámenes del SAT, los algoritmos pudieron rellenar con éxito los huecos en blanco en un 53 por ciento de los casos. Con los textos de Holmes, el sistema consiguió una tasa de éxito del 52 por ciento. “No es perfecto, pero mejor de lo que se puede esperar por pura casualidad”, matizan los investigadores.

Es más, el equipo fue capaz de identificar las áreas que se podrían mejorar. “Es alentador que la tercera parte de los errores se refieran a cuestiones de una sola palabra, lo que pone a prueba la definición del diccionario de una palabra”, advirtieron. Así, predicen que “con unos pocos ajustes, debe ser posible reducir esos errores”.

Sin embargo, todavía queda un 40% de los errores que parece más complicado de resolver, aquellos asociados con un cierto nivel de conocimiento general. Por ejemplo, en la frase: “Muchos temen que la [espacio en blanco] de una publicidad del tabaco más benevolente podría ser perjudicial para la salud pública”, el algoritmo se decidió por la respuesta «retirada», en lugar de la opción correcta, «ratificación».

Resolver ese problema significa que quedan aún unos cuantos años antes de que los ordenadores sean capaces de terminar con éxito total las frases de los humanos. Los investigadores seguirán trabajando para perfeccionar los dos enfoques analizados, ya que consideran que se obtienen mejores resultados que dejándolo al azar, combinando ambos métodos como una opción posible.

De momento, se conforman con dar a conocer el estudio inicial, el cual se presentará oficialmente en el 50 Congreso Anual de la Asociación de Lingüística Computacional (ACL), el fórum principal en el que se exponen las investigaciones más significativas sobre lingüística computacional y procesamiento del lenguaje natural, y que en esta ocasión se celebra en la isla de Jeju, Corea.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Podemos comprender oraciones escritas en un parpadeo 16 febrero, 2025
    Nuestro cerebro puede entender oraciones escritas en lo que dura el parpadeo de un ojo, según revela un nuevo estudio. Los científicos descubrieron que el procesamiento del lenguaje escrito ocurre a velocidades significativamente más rápidas de las necesarias para hablar o comunicarse en voz alta.
    Pablo Javier Piacente
  • Un misterioso pulso marca la música del corazón de la Vía Láctea 15 febrero, 2025
    El corazón de nuestra galaxia late con una señal misteriosa: cada 76 minutos, como un reloj, el flujo de rayos gamma de Sagitario A*, el agujero negro supermasivo ubicado en el corazón de nuestra galaxia, fluctúa por una razón aún no definida. Según los investigadores, es similar en periodicidad a los cambios en la emisión […]
    Pablo Javier Piacente
  • Las ganas de postre surgen en el cerebro cuando hemos comido bien 14 febrero, 2025
    Los investigadores demostraron que un grupo de células nerviosas, denominadas neuronas POMC, son las responsables de mantener nuestras ganas de comer postre, a pesar de haber disfrutado de un almuerzo o una cena suculenta que nos ha saciado. En roedores y humanos, estas neuronas se activan tan pronto como se tiene acceso al azúcar, facilitando […]
    Pablo Javier Piacente / T21
  • ¿ChatGPT reemplazará a los psicoterapeutas en el futuro? 14 febrero, 2025
    Los científicos descubrieron que las respuestas producidas por el popular sistema ChatGPT eran generalmente mejor valoradas que las entregadas por un psicólogo humano en el marco de una situación de terapia de pareja: eran más largas y contenían más sustantivos y adjetivos, aportando una mayor contextualización.
    Pablo Javier Piacente / T21
  • Una bacteria podría resolver los crímenes ligados a agresiones sexuales 14 febrero, 2025
    Una especie bacteriana única, conocida como “sexoma”, se transfiere entre individuos durante las relaciones sexuales. Estas firmas microbianas podrían servir como evidencia forense, incluso cuando no existan marcadores de ADN tradicionales, transformándose en una herramienta clave para la resolución de delitos que involucren agresiones sexuales.
    Redacción T21
  • ¿Será capaz Europa de subirse al tren de la Inteligencia Artificial? 14 febrero, 2025
    Europa va a invertir 309.000 millones de euros en Inteligencia artificial, muy lejos de los 500.000 euros que se propone Estados Unidos, mediante una iniciativa público-privada que parece más un ideal que un plan de acción realista. De momento.
    EDUARDO MARTÍNEZ DE LA FE/T21
  • Descubren el lugar exacto dónde la vida comenzó a desarrollarse en la Tierra primitiva 13 febrero, 2025
    Científicos estadounidenses concluyen en un nuevo estudio que los primeros microorganismos que se adaptaron de un entorno prehistórico con poco oxígeno al que existe en la actualidad lo lograron en ambientes semejantes a los enormes géiseres del actual Parque Nacional de Yellowstone, ubicado en el oeste de Estados Unidos, hace aproximadamente 2.400 millones de años.
    Pablo Javier Piacente / T21
  • Comprobado en ratones: el estrés intensivo provoca sordera 13 febrero, 2025
    Los resultados de un nuevo estudio muestran que el estrés repetido podría cambiar la forma en que percibimos y respondemos al mundo que nos rodea: en roedores, los científicos comprobaron que se producen cambios en la forma en que el cerebro procesa el sonido, disminuyendo la capacidad para percibir los ruidos más intensos.
    Pablo Javier Piacente / T21
  • El neutrino que atravesó el Mediterráneo abre una nueva ventana energética al Universo 13 febrero, 2025
    Los científicos afirman que la fuente de una partícula de alta energía que atravesó el mar Mediterráneo en 2023 es todavía un enigma, abriendo un escenario desconocido de la energía cósmica. El destello de luz identificado a 3,5 kilómetros de profundidad ha dejado ver la presencia de un visitante cósmico sin precedentes: un neutrino con […]
    Redacción T21
  • La ciencia llama a la resistencia ante Trump 13 febrero, 2025
    La reconocida revista Science ha hecho un llamamiento a la comunidad científica para resistir a los recortes a los Institutos Nacionales de Salud (NIH) planeados por el presidente estadounidense Donald Trump.
    Redacción T21