Tendencias21
Enseñan a los ordenadores a clasificar información por sí solos

Enseñan a los ordenadores a clasificar información por sí solos

La interacción hombre-máquina es imprescindible para categorizar grandes volúmenes de información. Lo habitual es que sean los expertos quienes coloquen las primeras etiquetas, con las que los equipos construyen una base de comparación para la clasificación posterior de nuevos datos. Sin embargo, un equipo de investigadores de la Universidad de Wisconsin, en Estados Unidos, sugiere invertir el modelo, de forma que sea la máquina la que etiquete directamente, recurriendo al hombre sólo en casos confusos. Por Patricia Pérez.

Enseñan a los ordenadores a clasificar información por sí solos

Los ordenadores son instrumentos poderosos para clasificar, visualizar y buscar información. Sin embargo, son simplemente el medio a través del que accedemos a esos grandes volúmenes de datos. “En realidad necesitamos la interacción hombre-máquina para que funcionen bien”, asegura Rob Nowak, profesor de Ingeniería Eléctrica e Informática en la Universidad de Wisconsin-Madison (UW), Estados Unidos.

En un comunicado de la UW, el investigador señala que “no se puede dar más de una tonelada de datos en bruto y dejar que la máquina trabaje”. Como en todos los ámbitos, cada uno tiene sus puntos fuertes y débiles. A diferencia de los ordenadores, los humanos no se pueden actualizar. Por el contrario, los equipos requieren gran velocidad para este tipo de tareas, lo que supone un aumento de los costos.

Así las cosas, el objetivo de Nowak es mejorar los sistemas interactivos para que hombre y máquina puedan abordan los problemas de Big Data juntos. Hasta ahora lo habitual es que, quienes categorizan datos, reciban grandes volúmenes de forma aleatoria para etiquetar.

En función a esas etiquetas, el equipo construye una base de comparación para el etiquetado posterior de nuevos datos. Sin embargo, Nowak sugiere invertir el modelo. “En lugar de que alguien tenga que etiquetar un conjunto aleatorio de ejemplos, que la máquina lo haga directamente, recurriendo al hombre en aquellos volúmenes específicos que encontrara confusos”, apunta el profesor.

Para conseguirlo ha estado explorando un modelo de aprendizaje activo, en el que la máquina recibe toda la información directamente. En base a ello trabaja junto a su alumno Kevin Jamieson, con el apoyo de la Fundación Nacional de Ciencia de EEUU.

La cerveza ideal

El aprendizaje activo se utiliza en el campo de la pedagogía para fomentar una metodología participativa de los estudiantes. Prima que los alumnos observen por su cuenta, busquen información y reflexionen acerca de lo que aprenden, en lugar de asimilar conocimientos únicamente de forma pasiva. Se trata de un método que potencia su autonomía, aplicando lo aprendido en la resolución de problemas.

Trasladado al trabajo con grandes volúmenes de datos, el objetivo es similar, dar mayor autonomía al equipo para mejorar su aprendizaje. De esta forma, inicialmente, sin etiquetas, el ordenador hace predicciones muy pobres, mejorando cuando un experto aporta etiquetas para algunos datos. A partir de ahí, si un nuevo punto es similar a uno ya marcado previamente por el hombre, la máquina es capaz de predecir que debe llevar probablemente la misma etiqueta.

Asimismo, el equipo puede usar semejanzas y etiquetas para cuantificar su confianza en las predicciones que realiza. De este modo, si el nivel de confianza es bajo, entonces acude al consejo externo.

Para probar la eficacia de este tipo de interacciones hombre-máquina, Nowak ha recurrido a una aplicación para iOS desarrollada también en la UW, capaz de predecir qué cerveza artesanal preferirá un usuario.

En este caso, las similitudes entre los datos -cervezas- se basan en el sabor, el color y otras características definidas por el espectro de términos utilizados para describirlas en las reseñas de Ratebeer, web que ofrece una completa base de datos con las mejores cervezas del mundo gracias a la opinión de los internautas.

Utilizando esta información como base, el algoritmo encuentra las coincidencias más cercanas a las preferencias del usuario. Casi de la misma manera que lo haría un camarero puede presentar dos opciones, recurriendo a continuación a los gustos del usuario para afinar la mejor selección.

“Básicamente, si ya sé que prefieres Spotted Cow a Guinness, no voy a recomendarte ninguna otra cerveza negra”, explica Nowak. Este tipo de determinaciones «esto o aquello» tienden a ser más estables que las categorizaciones basadas en escalas de clasificación u otras medidas más subjetivas, vulnerables a efectos psicológicos y que pueden resultar pasajeras. Las comparaciones de datos más exactos ofrecen a la máquina información más fiable para mejorar la clasificación y predicción con el tiempo.

Y lo más importante, permite que los equipos procesen la información mucho más rápido, ya que requieren menos ayuda humana para categorizar los datos. Por ejemplo, partiendo de una base de datos con miles de cervezas posibles, el investigador subraya que la aplicación puede hacer una recomendación personalizada tomando como base de 10 a 20 comparaciones.

Enseñan a los ordenadores a clasificar información por sí solos

La emoción de las palabras

Este tipo de eficiencia es crucial cuanto más grandes son los volúmenes de datos, ya que el trabajo humano no puede mantener el ritmo. Por otra parte, en colaboración con compañeros de Psicología de la UW, Nowak ha aplicado su modelo para estudiar la emoción relativa de las palabras. Sin el modelo de aprendizaje automático activo, encontrar similitudes entre 400 palabras podría requerir hasta 30 millones de comparaciones totales. “Incluso si se pudiera reclutar un batallón de 1.000 estudiantes, todavía corresponderían 30.000 ensayos a cada uno”, señala.

Sin embargo, entender juicios humanos sobre la similitud del significado de ciertas palabras es un reto fundamental en la ciencia cognitiva, aquella que estudia cómo se representa y transforma la información en el cerebro, y absolutamente crucial para conseguir que las máquinas sean capaces de comprender las sutilezas del lenguaje humano. “Tenemos la infraestructura necesaria. Lo que no sabemos es cómo encajar la broma o el doble sentido y la máquina en grandes análisis de datos”, lamenta el profesor. Cuestión de tiempo.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • La IA podría ser el límite para todas las civilizaciones avanzadas en el Universo 10 abril, 2024
    Un nuevo estudio sugiere que el desarrollo de la Inteligencia Artificial (IA) hacia una Superinteligencia Artificial (ASI) podría explicar por qué no hemos detectado aún otras civilizaciones avanzadas en el cosmos, a pesar de la alta probabilidad de su existencia: en vez de supernovas, plagas, guerras nucleares o eventos climáticos extremos que hayan sido un […]
    Pablo Javier Piacente
  • Higgs ha podido dejar abierta la puerta a la Nueva Física 10 abril, 2024
    La muerte de Peter Higgs, que pasará a la historia como el descubridor del bosón que explica cómo se forma la materia, deja un legado en la historia de la física que todavía puede aportar algo más trascendente: la prueba definitiva de una Nueva Física más allá del Modelo Estándar.
    Eduardo Martínez de la Fe
  • Descubren neuronas "zombis" en el cerebro, que serían claves en el proceso de aprendizaje 9 abril, 2024
    Las neuronas "zombis" son unidades vivas pero funcionalmente alteradas, que parecen "dormidas" en determinadas situaciones: los investigadores han revelado que cumplen un papel fundamental en el cerebelo, concretamente en aspectos relativos a la forma en la cual aprendemos.
    Pablo Javier Piacente
  • La Luna se invirtió por completo hace más de 4 mil millones de años 9 abril, 2024
    Hace unos 4.220 millones de años, poco después de que la Luna se formara a partir de un trozo de la Tierra que se desprendió durante una colisión violenta a principios de la historia del Sistema Solar, nuestro satélite se dio vuelta y comenzó así una etapa clave de su desarrollo. Así lo ha comprobado […]
    Pablo Javier Piacente
  • Arte rupestre de hace 2.000 años podría representar música psicodélica 9 abril, 2024
    Aunque la música psicodélica moderna no nació hasta la década de 1960, las influencias psicodélicas se pueden encontrar en el arte rupestre de hace miles de años. Grabados precolombinos en piedra, de 2.000 años de antigüedad, reflejan figuras humanas bailando en estado de trance chamánico.
    Redacción T21
  • Descubren antiguas partículas de polvo espacial provenientes de otro sistema estelar 8 abril, 2024
    Los astrónomos han descubierto una rara partícula de polvo atrapada en un antiguo meteorito extraterrestre, que fue formado por una estrella distinta a nuestro Sol. El polvo se habría originado luego de una supernova: las partículas son como "cápsulas del tiempo celestes" y proporcionan una instantánea de la vida de su estrella madre.
    Pablo Javier Piacente
  • Un lejano mundo deja ver una increíble explosión de luz en sus cielos "metálicos" 8 abril, 2024
    Utilizando datos del Telescopio Espacial CHEOPS de la Agencia Espacial Europea (ESA), cuyo centro de operaciones científicas se localiza en la Universidad de Ginebra, en Suiza, un equipo internacional de científicos logró detectar por primera vez un extraño fenómeno lumínico denominado “gloria” en un exoplaneta: el estallido de luz se apreció en WASP-76b, un mundo […]
    Pablo Javier Piacente
  • El ordenador cuántico desembarca en el mundo universitario 8 abril, 2024
    La última computadora cuántica System One de IBM se ha instalado en el Instituto Politécnico Rensselaer (RPI) en Nueva York. Es la primera máquina cuántica de IBM instalada en un campus universitario de Estados Unidos. Una revolución en el mundo académico que impulsa la formación de un ecosistema cuántico global.
    Eduardo Martínez de la Fe
  • Los cocodrilos imitan a las ballenas antes de aparearse 7 abril, 2024
    Los cocodrilos cortejan a las hembras lanzando un chorro de agua al aire, tal como hacen las ballenas cuando salen a la superficie. A ellas les encantan también los silbidos y las burbujas que les dedican sus parejas antes de aparearse. Se está elaborando un diccionario de cocodrilos.
    Redacción T21
  • Los drones policiales se implantan en Estados Unidos 6 abril, 2024
    Chula Vista, un suburbio de San Diego, California, con una población de 275.000 habitantes, es una de las pocas ciudades estadounidenses que utiliza sistemáticamente drones para ayudar a la policía en caso de emergencia. En activo desde 2018, el sistema está sirviendo de referencia a otros Estados y tal vez otros países.
    Redacción T21