Tendencias21
Enseñan a los ordenadores a clasificar información por sí solos

Enseñan a los ordenadores a clasificar información por sí solos

La interacción hombre-máquina es imprescindible para categorizar grandes volúmenes de información. Lo habitual es que sean los expertos quienes coloquen las primeras etiquetas, con las que los equipos construyen una base de comparación para la clasificación posterior de nuevos datos. Sin embargo, un equipo de investigadores de la Universidad de Wisconsin, en Estados Unidos, sugiere invertir el modelo, de forma que sea la máquina la que etiquete directamente, recurriendo al hombre sólo en casos confusos. Por Patricia Pérez.

Enseñan a los ordenadores a clasificar información por sí solos

Los ordenadores son instrumentos poderosos para clasificar, visualizar y buscar información. Sin embargo, son simplemente el medio a través del que accedemos a esos grandes volúmenes de datos. “En realidad necesitamos la interacción hombre-máquina para que funcionen bien”, asegura Rob Nowak, profesor de Ingeniería Eléctrica e Informática en la Universidad de Wisconsin-Madison (UW), Estados Unidos.

En un comunicado de la UW, el investigador señala que “no se puede dar más de una tonelada de datos en bruto y dejar que la máquina trabaje”. Como en todos los ámbitos, cada uno tiene sus puntos fuertes y débiles. A diferencia de los ordenadores, los humanos no se pueden actualizar. Por el contrario, los equipos requieren gran velocidad para este tipo de tareas, lo que supone un aumento de los costos.

Así las cosas, el objetivo de Nowak es mejorar los sistemas interactivos para que hombre y máquina puedan abordan los problemas de Big Data juntos. Hasta ahora lo habitual es que, quienes categorizan datos, reciban grandes volúmenes de forma aleatoria para etiquetar.

En función a esas etiquetas, el equipo construye una base de comparación para el etiquetado posterior de nuevos datos. Sin embargo, Nowak sugiere invertir el modelo. “En lugar de que alguien tenga que etiquetar un conjunto aleatorio de ejemplos, que la máquina lo haga directamente, recurriendo al hombre en aquellos volúmenes específicos que encontrara confusos”, apunta el profesor.

Para conseguirlo ha estado explorando un modelo de aprendizaje activo, en el que la máquina recibe toda la información directamente. En base a ello trabaja junto a su alumno Kevin Jamieson, con el apoyo de la Fundación Nacional de Ciencia de EEUU.

La cerveza ideal

El aprendizaje activo se utiliza en el campo de la pedagogía para fomentar una metodología participativa de los estudiantes. Prima que los alumnos observen por su cuenta, busquen información y reflexionen acerca de lo que aprenden, en lugar de asimilar conocimientos únicamente de forma pasiva. Se trata de un método que potencia su autonomía, aplicando lo aprendido en la resolución de problemas.

Trasladado al trabajo con grandes volúmenes de datos, el objetivo es similar, dar mayor autonomía al equipo para mejorar su aprendizaje. De esta forma, inicialmente, sin etiquetas, el ordenador hace predicciones muy pobres, mejorando cuando un experto aporta etiquetas para algunos datos. A partir de ahí, si un nuevo punto es similar a uno ya marcado previamente por el hombre, la máquina es capaz de predecir que debe llevar probablemente la misma etiqueta.

Asimismo, el equipo puede usar semejanzas y etiquetas para cuantificar su confianza en las predicciones que realiza. De este modo, si el nivel de confianza es bajo, entonces acude al consejo externo.

Para probar la eficacia de este tipo de interacciones hombre-máquina, Nowak ha recurrido a una aplicación para iOS desarrollada también en la UW, capaz de predecir qué cerveza artesanal preferirá un usuario.

En este caso, las similitudes entre los datos -cervezas- se basan en el sabor, el color y otras características definidas por el espectro de términos utilizados para describirlas en las reseñas de Ratebeer, web que ofrece una completa base de datos con las mejores cervezas del mundo gracias a la opinión de los internautas.

Utilizando esta información como base, el algoritmo encuentra las coincidencias más cercanas a las preferencias del usuario. Casi de la misma manera que lo haría un camarero puede presentar dos opciones, recurriendo a continuación a los gustos del usuario para afinar la mejor selección.

“Básicamente, si ya sé que prefieres Spotted Cow a Guinness, no voy a recomendarte ninguna otra cerveza negra”, explica Nowak. Este tipo de determinaciones «esto o aquello» tienden a ser más estables que las categorizaciones basadas en escalas de clasificación u otras medidas más subjetivas, vulnerables a efectos psicológicos y que pueden resultar pasajeras. Las comparaciones de datos más exactos ofrecen a la máquina información más fiable para mejorar la clasificación y predicción con el tiempo.

Y lo más importante, permite que los equipos procesen la información mucho más rápido, ya que requieren menos ayuda humana para categorizar los datos. Por ejemplo, partiendo de una base de datos con miles de cervezas posibles, el investigador subraya que la aplicación puede hacer una recomendación personalizada tomando como base de 10 a 20 comparaciones.

Enseñan a los ordenadores a clasificar información por sí solos

La emoción de las palabras

Este tipo de eficiencia es crucial cuanto más grandes son los volúmenes de datos, ya que el trabajo humano no puede mantener el ritmo. Por otra parte, en colaboración con compañeros de Psicología de la UW, Nowak ha aplicado su modelo para estudiar la emoción relativa de las palabras. Sin el modelo de aprendizaje automático activo, encontrar similitudes entre 400 palabras podría requerir hasta 30 millones de comparaciones totales. “Incluso si se pudiera reclutar un batallón de 1.000 estudiantes, todavía corresponderían 30.000 ensayos a cada uno”, señala.

Sin embargo, entender juicios humanos sobre la similitud del significado de ciertas palabras es un reto fundamental en la ciencia cognitiva, aquella que estudia cómo se representa y transforma la información en el cerebro, y absolutamente crucial para conseguir que las máquinas sean capaces de comprender las sutilezas del lenguaje humano. “Tenemos la infraestructura necesaria. Lo que no sabemos es cómo encajar la broma o el doble sentido y la máquina en grandes análisis de datos”, lamenta el profesor. Cuestión de tiempo.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • ¿Fue la Edad del Hierro un período histórico matriarcal? 23 enero, 2025
    Genetistas y arqueólogos han descubierto a través del análisis de ADN antiguo evidencia convincente que sugiere que la Edad del Hierro de Gran Bretaña puede haber sido aún más matriarcal de aquello que se pensaba anteriormente: las tierras se transmitían a la descendencia femenina, por ejemplo, siendo la primera vez que se documenta este tipo […]
    Redacción T21
  • Un enorme objeto interestelar modificó para siempre a nuestro Sistema Solar 22 enero, 2025
    Un estudio sugiere que es posible que un objeto de origen interestelar de enorme tamaño y peso se introdujera en el Sistema Solar al principio de su formación, dejando una huella imborrable en las órbitas planetarias, antes de desviarse nuevamente hacia otros confines del Universo. El visitante fugaz podría haber tenido características similares al misterioso […]
    Pablo Javier Piacente / T21
  • Cada vez más cerca de la energía limpia e ilimitada: el “Sol artificial” de China rompe un nuevo récord 22 enero, 2025
    La posibilidad de disfrutar de una fuente energética limpia e inagotable está más cerca de ser una realidad, luego que este lunes 20 de enero el Experimental Advanced Superconducting Tokamak (EAST), el reactor de fusión experimental conocido como el “Sol artificial” chino, rompiera un nuevo récord de producción de plasma: superó en más del doble […]
    Pablo Javier Piacente / T21
  • La costumbre de orinar en grupos provendría de los monos 22 enero, 2025
    Las personas generalmente van al baño en grupos: según una nueva investigación, los chimpancés hacen lo mismo, posiblemente para fortalecer los lazos sociales. Es posible que la tendencia en los seres humanos hacia la "micción contagiosa" sea una herencia evolutiva proveniente de otros primates.
    Redacción T21
  • Descubren antiguos sacrificios para hacer "renacer" al Sol después de una enorme erupción volcánica 21 enero, 2025
    Cientos de artefactos de piedra descubiertos en la isla danesa de Bornholm pueden haber sido ofrecidos a los dioses para evitar una crisis climática: se entregaron a modo de sacrificio hace casi 5.000 años, para lograr el "regreso" de un Sol oscurecido luego de una gigantesca erupción volcánica. Los investigadores creen que todo el hemisferio […]
    Pablo Javier Piacente / T21
  • El cambio climático está "atrapando" a algunas bacterias en un bucle temporal eterno 21 enero, 2025
    Especies de bacterias en un lago de Wisconsin están en una suerte de "bucle interminable" evolutivo: han crecido rápidamente y regresado abruptamente a su estado inicial, repitiendo una y otra vez ese ciclo, aparentemente en respuesta a estaciones y otros parámetros ambientales que cambiaron drásticamente como consecuencia del cambio climático.
    Pablo Javier Piacente / T21
  • Tendremos un futuro utópico y distópico a la vez 21 enero, 2025
    La nueva edición de la exposición ArtFutura, que se desarrolla en el Palacio Neptuno de Madrid, transmite un mensaje claro: la Inteligencia Artificial Generativa no es una amenaza para el arte, sino una nueva herramienta que expande los límites de nuestra creatividad. Sin miedo.
    Alejandro Sacristán (enviado especial T21)
  • Una interfaz cerebro-ordenador permite a una persona con parálisis operar un helicóptero virtual 21 enero, 2025
    La interfaz cerebro-ordenador puede permitir a las personas con parálisis interactuar con otros, participar en trabajos remotos y disfrutar de actividades recreativas: un implante colocado quirúrgicamente en una persona con parálisis en las cuatro extremidades proporcionó un nivel de control sin precedentes sobre un cuadricóptero virtual, solo pensando en el movimiento de los dedos para […]
    Redacción T21
  • Una abeja robótica rompe los récords de polinización y hace acrobacias en el aire 20 enero, 2025
    Un insecto-robot que simula a una abeja y pesa menos de un gramo, aletea con la misma eficacia que los insectos en la naturaleza y fue diseñado para la polinización artificial: podría sentar las bases para una producción agrícola realizada totalmente es espacios interiores. El avance permitiría cultivar frutas y verduras dentro de un almacén […]
    Pablo Javier Piacente / T21
  • Nuevos hallazgos reafirman el origen genético de la depresión 20 enero, 2025
    Un nuevo estudio señala los "genes de la depresión" en todas las etnias: se trata de 239 factores de riesgo genéticos para la depresión que inciden en todas las principales poblaciones mundiales. Esto permitirá a los científicos predecir por primera vez el riesgo de depresión independientemente del origen étnico de cada persona.
    Pablo Javier Piacente / T21