Tendencias21
Enseñan a los ordenadores a clasificar información por sí solos

Enseñan a los ordenadores a clasificar información por sí solos

La interacción hombre-máquina es imprescindible para categorizar grandes volúmenes de información. Lo habitual es que sean los expertos quienes coloquen las primeras etiquetas, con las que los equipos construyen una base de comparación para la clasificación posterior de nuevos datos. Sin embargo, un equipo de investigadores de la Universidad de Wisconsin, en Estados Unidos, sugiere invertir el modelo, de forma que sea la máquina la que etiquete directamente, recurriendo al hombre sólo en casos confusos. Por Patricia Pérez.

Enseñan a los ordenadores a clasificar información por sí solos

Los ordenadores son instrumentos poderosos para clasificar, visualizar y buscar información. Sin embargo, son simplemente el medio a través del que accedemos a esos grandes volúmenes de datos. “En realidad necesitamos la interacción hombre-máquina para que funcionen bien”, asegura Rob Nowak, profesor de Ingeniería Eléctrica e Informática en la Universidad de Wisconsin-Madison (UW), Estados Unidos.

En un comunicado de la UW, el investigador señala que “no se puede dar más de una tonelada de datos en bruto y dejar que la máquina trabaje”. Como en todos los ámbitos, cada uno tiene sus puntos fuertes y débiles. A diferencia de los ordenadores, los humanos no se pueden actualizar. Por el contrario, los equipos requieren gran velocidad para este tipo de tareas, lo que supone un aumento de los costos.

Así las cosas, el objetivo de Nowak es mejorar los sistemas interactivos para que hombre y máquina puedan abordan los problemas de Big Data juntos. Hasta ahora lo habitual es que, quienes categorizan datos, reciban grandes volúmenes de forma aleatoria para etiquetar.

En función a esas etiquetas, el equipo construye una base de comparación para el etiquetado posterior de nuevos datos. Sin embargo, Nowak sugiere invertir el modelo. “En lugar de que alguien tenga que etiquetar un conjunto aleatorio de ejemplos, que la máquina lo haga directamente, recurriendo al hombre en aquellos volúmenes específicos que encontrara confusos”, apunta el profesor.

Para conseguirlo ha estado explorando un modelo de aprendizaje activo, en el que la máquina recibe toda la información directamente. En base a ello trabaja junto a su alumno Kevin Jamieson, con el apoyo de la Fundación Nacional de Ciencia de EEUU.

La cerveza ideal

El aprendizaje activo se utiliza en el campo de la pedagogía para fomentar una metodología participativa de los estudiantes. Prima que los alumnos observen por su cuenta, busquen información y reflexionen acerca de lo que aprenden, en lugar de asimilar conocimientos únicamente de forma pasiva. Se trata de un método que potencia su autonomía, aplicando lo aprendido en la resolución de problemas.

Trasladado al trabajo con grandes volúmenes de datos, el objetivo es similar, dar mayor autonomía al equipo para mejorar su aprendizaje. De esta forma, inicialmente, sin etiquetas, el ordenador hace predicciones muy pobres, mejorando cuando un experto aporta etiquetas para algunos datos. A partir de ahí, si un nuevo punto es similar a uno ya marcado previamente por el hombre, la máquina es capaz de predecir que debe llevar probablemente la misma etiqueta.

Asimismo, el equipo puede usar semejanzas y etiquetas para cuantificar su confianza en las predicciones que realiza. De este modo, si el nivel de confianza es bajo, entonces acude al consejo externo.

Para probar la eficacia de este tipo de interacciones hombre-máquina, Nowak ha recurrido a una aplicación para iOS desarrollada también en la UW, capaz de predecir qué cerveza artesanal preferirá un usuario.

En este caso, las similitudes entre los datos -cervezas- se basan en el sabor, el color y otras características definidas por el espectro de términos utilizados para describirlas en las reseñas de Ratebeer, web que ofrece una completa base de datos con las mejores cervezas del mundo gracias a la opinión de los internautas.

Utilizando esta información como base, el algoritmo encuentra las coincidencias más cercanas a las preferencias del usuario. Casi de la misma manera que lo haría un camarero puede presentar dos opciones, recurriendo a continuación a los gustos del usuario para afinar la mejor selección.

“Básicamente, si ya sé que prefieres Spotted Cow a Guinness, no voy a recomendarte ninguna otra cerveza negra”, explica Nowak. Este tipo de determinaciones «esto o aquello» tienden a ser más estables que las categorizaciones basadas en escalas de clasificación u otras medidas más subjetivas, vulnerables a efectos psicológicos y que pueden resultar pasajeras. Las comparaciones de datos más exactos ofrecen a la máquina información más fiable para mejorar la clasificación y predicción con el tiempo.

Y lo más importante, permite que los equipos procesen la información mucho más rápido, ya que requieren menos ayuda humana para categorizar los datos. Por ejemplo, partiendo de una base de datos con miles de cervezas posibles, el investigador subraya que la aplicación puede hacer una recomendación personalizada tomando como base de 10 a 20 comparaciones.

Enseñan a los ordenadores a clasificar información por sí solos

La emoción de las palabras

Este tipo de eficiencia es crucial cuanto más grandes son los volúmenes de datos, ya que el trabajo humano no puede mantener el ritmo. Por otra parte, en colaboración con compañeros de Psicología de la UW, Nowak ha aplicado su modelo para estudiar la emoción relativa de las palabras. Sin el modelo de aprendizaje automático activo, encontrar similitudes entre 400 palabras podría requerir hasta 30 millones de comparaciones totales. “Incluso si se pudiera reclutar un batallón de 1.000 estudiantes, todavía corresponderían 30.000 ensayos a cada uno”, señala.

Sin embargo, entender juicios humanos sobre la similitud del significado de ciertas palabras es un reto fundamental en la ciencia cognitiva, aquella que estudia cómo se representa y transforma la información en el cerebro, y absolutamente crucial para conseguir que las máquinas sean capaces de comprender las sutilezas del lenguaje humano. “Tenemos la infraestructura necesaria. Lo que no sabemos es cómo encajar la broma o el doble sentido y la máquina en grandes análisis de datos”, lamenta el profesor. Cuestión de tiempo.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Descubierto el ritual más antiguo del mundo, transmitido durante 500 generaciones 2 julio, 2024
    Un ritual ancestral en una cueva de Australia podría ser el más antiguo del mundo: practicado durante 500 generaciones por indígenas australianos, se desarrolla sin interrupciones desde hace 12.000 años hasta la actualidad, aunque fue documentado inicialmente en el siglo XIX. Identificado a partir de restos de viejas fogatas, los científicos creen que podría ser […]
    Pablo Javier Piacente
  • Revelan un nuevo paraíso hidrotermal en las profundidades del océano 2 julio, 2024
    Frente a la costa de Svalbard, en Noruega, a más de 3.000 metros de profundidad, los científicos han descubierto un campo de fuentes hidrotermales a lo largo de la cresta Knipovich, una cadena montañosa submarina. El sitio esconde un oasis de extrañas formas de vida, capaces de prosperar en los ambientes más extremos de la […]
    Pablo Javier Piacente
  • El camino a los viajes espaciales de larga duración empieza a abrirse gracias a la criónica 2 julio, 2024
    La criónica ha conseguido revivir a gusanos y ampliar la ralentización biológica en operaciones a corazón abierto. El siguiente paso será la criopreservación de órganos y organismos enteros de forma reversible a temperaturas bajo cero. Entonces será posible viajar durante cientos de años a planetas lejanos.
    Alejandro Sacristán
  • Una sola molécula podría revertir el envejecimiento en los músculos y el cerebro 1 julio, 2024
    Un nuevo estudio en ratones y células humanas sugiere que una molécula especialmente seleccionada por los investigadores puede ayudar a revertir los signos del envejecimiento en los músculos y el cerebro, al extender los telómeros y modular genes de vital importancia. En concreto, la molécula inyecta dinamismo a una proteína denominada TERT, que es un engranaje […]
    Pablo Javier Piacente
  • El Telescopio Web detecta extrañas formas brillantes sobre Júpiter 1 julio, 2024
    En lo alto de la atmósfera de Júpiter, específicamente en la ionosfera, los astrónomos han identificado con la ayuda del Telescopio Espacial James Webb (JWST), nuevas características extrañas y brillantes. Se ubican en la región situada encima de la tempestuosa Gran Mancha Roja, y serían un reflejo de las potentes tormentas que se desatan en […]
    Pablo Javier Piacente
  • Fabrizio Gagliardi: la IA Generativa está provocando un giro copernicano en cómo hacemos ciencia 1 julio, 2024
    La comunidad científica se ha unido en un consorcio para alumbrar la IA de la ciencia, cuyo lanzamiento europeo tuvo lugar recientemente en Barcelona. Fabrizio Gagliardi, representante del BSC-CNS en ese consorcio, advierte que Europa está lejos de alcanzar el nivel de desarrollo de la IA Generativa que vemos en Estados Unidos.
    Eduardo Martínez de la Fe
  • Una revolucionaria mano biónica se fusiona directamente con el cuerpo humano 30 junio, 2024
    Una nueva mano biónica desarrollada por un grupo de investigadores se basa en una tecnología revolucionaria, capaz de conectar directamente la prótesis robótica a los huesos, músculos y nervios del usuario. Esto permite crear una interfaz humano-máquina, que facilita a la Inteligencia Artificial (IA) la traducción de señales cerebrales en movimientos simples pero precisos.
    Pablo Javier Piacente
  • Un proyecto global trabaja para crear de forma colaborativa un cerebro robótico general 29 junio, 2024
    El auge de la inteligencia artificial generativa impulsa un proyecto global que trabaja para crear un cerebro robótico general, capaz de generar androides como los que hemos visto hasta ahora solo en la ciencia ficción. Pero es cuestión de tiempo que convivamos con ellos en perfecta armonía. Ya no es una utopía.
    Eduardo Martínez de la Fe
  • Las hormigas invasoras hacen autostop para encontrar un nuevo hogar 28 junio, 2024
    Se sabe que los insectos son especialistas en utilizar todo tipo de formas de transporte para atravesar amplias distancias, pero un nuevo estudio ha revelado que las hormigas también dominan el autostop: estos insectos sociales recogen a toda la familia, incluida su reina, y se suben al primer vehículo que encuentran para emprender un viaje […]
    Pablo Javier Piacente
  • Los recuerdos imborrables se adhieren a algunas neuronas 28 junio, 2024
    Los científicos han descubierto una explicación biológica para los recuerdos a largo plazo, esos que acompañan a una persona prácticamente durante toda la vida. Revelaron que una molécula, KIBRA, sirve como “pegamento” para otras moléculas, consolidando así la formación de la memoria al activar y mantener una etiqueta sináptica persistente, que queda adherida a un […]
    Pablo Javier Piacente