Tendencias21
Enseñan a los ordenadores a clasificar información por sí solos

Enseñan a los ordenadores a clasificar información por sí solos

La interacción hombre-máquina es imprescindible para categorizar grandes volúmenes de información. Lo habitual es que sean los expertos quienes coloquen las primeras etiquetas, con las que los equipos construyen una base de comparación para la clasificación posterior de nuevos datos. Sin embargo, un equipo de investigadores de la Universidad de Wisconsin, en Estados Unidos, sugiere invertir el modelo, de forma que sea la máquina la que etiquete directamente, recurriendo al hombre sólo en casos confusos. Por Patricia Pérez.

Enseñan a los ordenadores a clasificar información por sí solos

Los ordenadores son instrumentos poderosos para clasificar, visualizar y buscar información. Sin embargo, son simplemente el medio a través del que accedemos a esos grandes volúmenes de datos. “En realidad necesitamos la interacción hombre-máquina para que funcionen bien”, asegura Rob Nowak, profesor de Ingeniería Eléctrica e Informática en la Universidad de Wisconsin-Madison (UW), Estados Unidos.

En un comunicado de la UW, el investigador señala que “no se puede dar más de una tonelada de datos en bruto y dejar que la máquina trabaje”. Como en todos los ámbitos, cada uno tiene sus puntos fuertes y débiles. A diferencia de los ordenadores, los humanos no se pueden actualizar. Por el contrario, los equipos requieren gran velocidad para este tipo de tareas, lo que supone un aumento de los costos.

Así las cosas, el objetivo de Nowak es mejorar los sistemas interactivos para que hombre y máquina puedan abordan los problemas de Big Data juntos. Hasta ahora lo habitual es que, quienes categorizan datos, reciban grandes volúmenes de forma aleatoria para etiquetar.

En función a esas etiquetas, el equipo construye una base de comparación para el etiquetado posterior de nuevos datos. Sin embargo, Nowak sugiere invertir el modelo. “En lugar de que alguien tenga que etiquetar un conjunto aleatorio de ejemplos, que la máquina lo haga directamente, recurriendo al hombre en aquellos volúmenes específicos que encontrara confusos”, apunta el profesor.

Para conseguirlo ha estado explorando un modelo de aprendizaje activo, en el que la máquina recibe toda la información directamente. En base a ello trabaja junto a su alumno Kevin Jamieson, con el apoyo de la Fundación Nacional de Ciencia de EEUU.

La cerveza ideal

El aprendizaje activo se utiliza en el campo de la pedagogía para fomentar una metodología participativa de los estudiantes. Prima que los alumnos observen por su cuenta, busquen información y reflexionen acerca de lo que aprenden, en lugar de asimilar conocimientos únicamente de forma pasiva. Se trata de un método que potencia su autonomía, aplicando lo aprendido en la resolución de problemas.

Trasladado al trabajo con grandes volúmenes de datos, el objetivo es similar, dar mayor autonomía al equipo para mejorar su aprendizaje. De esta forma, inicialmente, sin etiquetas, el ordenador hace predicciones muy pobres, mejorando cuando un experto aporta etiquetas para algunos datos. A partir de ahí, si un nuevo punto es similar a uno ya marcado previamente por el hombre, la máquina es capaz de predecir que debe llevar probablemente la misma etiqueta.

Asimismo, el equipo puede usar semejanzas y etiquetas para cuantificar su confianza en las predicciones que realiza. De este modo, si el nivel de confianza es bajo, entonces acude al consejo externo.

Para probar la eficacia de este tipo de interacciones hombre-máquina, Nowak ha recurrido a una aplicación para iOS desarrollada también en la UW, capaz de predecir qué cerveza artesanal preferirá un usuario.

En este caso, las similitudes entre los datos -cervezas- se basan en el sabor, el color y otras características definidas por el espectro de términos utilizados para describirlas en las reseñas de Ratebeer, web que ofrece una completa base de datos con las mejores cervezas del mundo gracias a la opinión de los internautas.

Utilizando esta información como base, el algoritmo encuentra las coincidencias más cercanas a las preferencias del usuario. Casi de la misma manera que lo haría un camarero puede presentar dos opciones, recurriendo a continuación a los gustos del usuario para afinar la mejor selección.

“Básicamente, si ya sé que prefieres Spotted Cow a Guinness, no voy a recomendarte ninguna otra cerveza negra”, explica Nowak. Este tipo de determinaciones «esto o aquello» tienden a ser más estables que las categorizaciones basadas en escalas de clasificación u otras medidas más subjetivas, vulnerables a efectos psicológicos y que pueden resultar pasajeras. Las comparaciones de datos más exactos ofrecen a la máquina información más fiable para mejorar la clasificación y predicción con el tiempo.

Y lo más importante, permite que los equipos procesen la información mucho más rápido, ya que requieren menos ayuda humana para categorizar los datos. Por ejemplo, partiendo de una base de datos con miles de cervezas posibles, el investigador subraya que la aplicación puede hacer una recomendación personalizada tomando como base de 10 a 20 comparaciones.

Enseñan a los ordenadores a clasificar información por sí solos

La emoción de las palabras

Este tipo de eficiencia es crucial cuanto más grandes son los volúmenes de datos, ya que el trabajo humano no puede mantener el ritmo. Por otra parte, en colaboración con compañeros de Psicología de la UW, Nowak ha aplicado su modelo para estudiar la emoción relativa de las palabras. Sin el modelo de aprendizaje automático activo, encontrar similitudes entre 400 palabras podría requerir hasta 30 millones de comparaciones totales. “Incluso si se pudiera reclutar un batallón de 1.000 estudiantes, todavía corresponderían 30.000 ensayos a cada uno”, señala.

Sin embargo, entender juicios humanos sobre la similitud del significado de ciertas palabras es un reto fundamental en la ciencia cognitiva, aquella que estudia cómo se representa y transforma la información en el cerebro, y absolutamente crucial para conseguir que las máquinas sean capaces de comprender las sutilezas del lenguaje humano. “Tenemos la infraestructura necesaria. Lo que no sabemos es cómo encajar la broma o el doble sentido y la máquina en grandes análisis de datos”, lamenta el profesor. Cuestión de tiempo.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Un enorme desierto en Asia se está transformando en un vergel gracias al cambio climático 1 junio, 2025
    Los hallazgos de un nuevo estudio muestran que la ecologización del desierto de Thar ha sido impulsada principalmente por más lluvias durante las temporadas de monzones de verano, un aumento del 64% en las precipitaciones en general por el cambio climático y, en segundo lugar, por la infraestructura de riego que lleva el agua subterránea […]
    Pablo Javier Piacente / T21
  • La NASA está observando una enorme y creciente anomalía en el campo magnético de la Tierra 31 mayo, 2025
    La NASA está haciendo un seguimiento detallado de la "abolladura" o "bache" en el campo magnético terrestre descubierta en 1961, que crece rápidamente y podría ser el preludio de una inversión geomagnética: ocurre cuando los polos magnéticos norte y sur intercambian posiciones.
    EDUARDO MARTÍNEZ DE LA FE/T21
  • Los árboles pueden predecir las erupciones volcánicas 30 mayo, 2025
    La NASA, en colaboración con el Instituto Smithsonian, en Estados Unidos, está desarrollando nuevos métodos para anticipar erupciones volcánicas. Cuando el magma asciende a la superficie libera dióxido de carbono, y los árboles cercanos que absorben ese gas se vuelven más verdes y frondosos. Satélites como Landsat 8 vigilan la vegetación en zonas volcánicas, captando […]
    Pablo Javier Piacente / T21
  • Los delfines se ponen nombres "en clave" 30 mayo, 2025
    Un nuevo estudio ha identificado que los delfines no solo se dan nombres para reconocerse, sino que además estas denominaciones podrían esconder información secreta o "en clave", que estaría ligada a los sistemas sociales que sustentan el equilibrio de sus comunidades.
    Pablo Javier Piacente / T21
  • Sorprenden a una “estrella araña” devorando a su compañera 30 mayo, 2025
    Una colaboración internacional de astrónomos ha identificado un extraño sistema estelar en el que un púlsar conocido como “estrella araña” devora material de su estrella compañera, en un hallazgo que representa un eslabón perdido en la evolución de sistemas binarios compactos. 
    Redacción T21
  • Planetas a la deriva: el origen caótico de los mundos lejanos respalda la existencia del Planeta Nueve 30 mayo, 2025
    En los márgenes más remotos de los sistemas planetarios, gigantes invisibles orbitan en silencio. Un nuevo modelo sugiere que estos mundos distantes son productos inevitables del caos primordial que reina cuando las estrellas y sus planetas compiten por sobrevivir en los abarrotados viveros estelares. ¿Podría nuestro propio Sistema Solar albergar uno de estos esquivos colosos?
    EDUARDO MARTÍNEZ DE LA FE/T21
  • Unas gafas de realidad mixta devuelven "el mundo entero" a las personas con pérdida parcial de la visión 29 mayo, 2025
    Una técnica desarrollada por oftalmólogos e informáticos canadienses devuelve la visión perdida a personas afectadas por una lesión cerebral, que han sufrido la reducción de gran parte de su campo visual. Las gafas de realidad mixta registran y "proyectan" ese sector que las personas no pueden ver con sus ojos.
    Pablo Javier Piacente / T21
  • Primer combate de kickboxing con robots humanoides 29 mayo, 2025
    En Hangzhou, China, se celebró el 25 de mayo de 2025 el primer torneo mundial de kickboxing entre robots humanoides, un espectáculo que, según los organizadores, marcó “un momento histórico en la integración de la Inteligencia Artificial (IA) en los deportes de combate”. 
    Pablo Javier Piacente / T21
  • Primera evidencia directa del pensamiento simbólico neandertal 29 mayo, 2025
    El meticuloso análisis de un canto rodado del Paleolítico Medio aporta una prueba tangible del comportamiento simbólico y la capacidad de abstracción de los últimos neandertales que habitaron la Península Ibérica, pudiendo representar una de las primeras simbolizaciones faciales conocidas.
    EDUARDO MARTÍNEZ DE LA FE/T21
  • Un "cóctel antienvejecimiento" alarga un 30% la vida en roedores 29 mayo, 2025
    Los científicos han probado un cóctel de medicamentos antienvejecimiento en ratones y descubrieron que extendía la vida útil de los animales en alrededor del 30 %. Los roedores también se mantuvieron más saludables por más tiempo, con menos inflamación crónica y retraso en el inicio de enfermedades como cáncer.
    Redacción T21