Tendencias21
Un nuevo algoritmo mejora los resultados de búsqueda en la web

Un nuevo algoritmo mejora los resultados de búsqueda en la web

Científicos del Instituto Tecnológico de Massachusetts han creado un algoritmo matemático que rastrea todos los comentarios publicados en diferentes webs para encontrar los resultados que más se adecuen a las características que esté buscando el usuario. El prototipo es capaz de deducir el valor semántico de las palabras a través de su posición en la frase y su relación con la puntuación numérica que conceden los internautas. Por Elena Higueras

Un nuevo algoritmo mejora los resultados de búsqueda en la web

Cada día existen más portales especializados que permiten localizar un determinado producto o servicio de acuerdo a unos criterios de búsqueda comunes. Por ejemplo, una web de reserva de restaurantes ofrece la posibilidad de elegir local en función del precio, la distancia al centro o el número de comensales, entre otros. Sin embargo, existen otras características menos usuales que para muchos internautas podrían constituir la diferencia entre contratar el menú de un negocio o el de su competidor, como quizá, el tamaño de las raciones, la comodidad de los asientos o la destreza del barman para preparar cócteles.

Ese tipo de información suele aparecer en los comentarios escritos por los usuarios de la web que ya han probado el restaurante señalado, pero revisar todas esas valoraciones podría significar hojear páginas y páginas de texto irrelevante. Ahora, gracias a un nuevo proyecto del Instituto Tecnológico de Massachusetts, la comunicación entre el hombre y la máquina puede estar más cerca de alcanzar un verdadero sentido semántico. Según un comunicado del MIT, el grupo del laboratorio de sistemas de lenguajes hablados, inteligencia artificial e informática de la institución estadounidense ha formulado un algoritmo que consigue peinar a automáticamente todos los comentarios de los usuarios para extraer la información útil publicada por éstos en la web y organizarla para facilitar las búsquedas.

Pero ¿cómo lo hace? En primer lugar, determinando la estructura gramatical de las frases que componen los comentarios y ordenando las palabras que se usan en parejas de nombre-adjetivo. Por ejemplo, si alguien ha escrito «me pareció que los martinis fueron excelentes», el algoritmo extrae la frase «martinis excelente.»

Como el nombre del grupo de investigación da a entender, su principal área de trabajo son los sistemas informáticos que responden al lenguaje hablado. De hecho, la interfaz de su prototipo está basada en el habla, de modo que un usuario podría buscar un restaurante de marisco simplemente diciendo «muéstrame una marisquería” en el micrófono de un ordenador o un teléfono móvil. En este sentido, el algoritmo que posibilita el análisis gramatical se remonta a hace una veintena de años, cuando la principal investigadora del actual grupo, Stephanie Seneff, lo comenzó a desarrollar como un componente de los sistemas de reconocimiento de voz. Ahora, ella y su estudiante de posgrado Liu Jingjing han aplicado este algoritmo para un caso sustancialmente diferente de análisis de texto escrito, con escasas modificaciones por lo que no estaban seguros de cómo les iría. «Teníamos que darnos prisa pero estamos absolutamente encantados con lo bien que ha funcionado», reconoce Seneff.

Correlación número-significado

El algoritmo da como resultado parejas de nombre-adjetivo (como «martini excelente» o «buenas vibraciones») basadas únicamente en las posiciones de las palabras en las frases, sin tener ni idea de lo que significan éstas. Por suerte, muchos sitios de valoraciones permiten a los usuarios proporcionan resultados numéricos de algunos aspectos de su experiencia como clientes. En el trabajo presentado en varias conferencias patrocinadas por la Asociación de Lingüística Computacional, Liu y Seneff presentaron un segundo sistema de algoritmos que utilizan clasificaciones numéricas para inferir los significados de los adjetivos. Si las personas que describir los alimentos como «excelentes» le dan siempre cinco de cinco estrellas, y quienes los califican como «horribles» solo le dan una, entonces el sistema deduce que «excelente» indica una mayor satisfacción del cliente que «horrible».

Una vez que el sistema ha calibrado una serie de adjetivos en relación a puntuaciones numéricas, utiliza esto para deducir el significado del resto de palabras. Por ejemplo, si el servicio en muchos restaurantes suele ser descrito como «horrible» y «grosero», el sistema llega a la conclusión de que tanto «grosero» como «horrible» son términos de reprobación. Del mismo modo, si el adjetivo «grosero» con frecuencia se combina con nombres como «servicio», «mozos» y «personal», pero no con palabras como «ver» o «aparcamiento», el prototipo deduce que «servicio», «camareros » y «personal» son términos relacionados temáticamente.

Como consecuencia, si un usuario pide al sistema que identifique restaurantes con un ambiente agradable, su lista de resultados de búsqueda incluirá locales descritos como «ambiente amigable», por ejemplo. También puede analizar información obtenida de los sitios web de las propias empresas para ampliar su repertorio semántico. Si, pongamos por caso, el foie gras y la sopa de marisco en un restaurante son constantemente alabados, y ambos están colocados bajo el título «aperitivos», entonces el sistema incluye el restaurante entre los locales con buenos aperitivos, incluso si la palabra «aperitivo» nunca aparece en ninguno de los comentarios.

Xiao Li, científico del grupo de investigación del lenguaje hablado de Microsoft, dice que la extracción de valoraciones cuantitativas de los comentarios no estructurados es un tema en auge, tanto en la academia como en la industria, puesto que diferentes productos comerciales ya ofrecen alguna versión de la misma funcionalidad. Sin embargo, en su opinión, el trabajo del MIT se diferencia en que «hace un montón de análisis lingüísticos”. Otros sistemas, por ejemplo, podrían tratar de inferir las relaciones entre las palabras sin antes determinar qué papel juegan en al oración. El enfoque que prevalecerá aún está por verse, dice, pero añade que la abundancia de la investigación en este campo demuestra que el trabajo tiene una importancia práctica obvia.

Tanto es así que ya existen dos prototipos del proyecto del MIT en la red, ambos con interfaces de voz. Uno tiene comandos en chino y contiene información sobre empresas en Taipei y Taiwán, y el otro tiene los tiene en Inglés e incluye información sobre empresas en Boston.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Un extraño objeto biológico dorado encontrado en el fondo del océano desconcierta a los científicos 11 enero, 2025
    Un equipo de investigadores descubrió a unos 3.300 metros bajo el nivel del mar, frente a la costa de Alaska, un extraño objeto biológico dorado que aún no ha podido clasificarse ni definirse. Los especialistas creen que el misterioso espécimen, de alrededor de 10 centímetros de ancho, podría ser una carcasa de huevo de una […]
    Pablo Javier Piacente/T21
  • Un gen neandertal ha modelado nuestras sonrisas 10 enero, 2025
    Los científicos hallaron diferencias dentales sustanciales entre distintas etnias humanas, potencialmente debido en parte a un gen heredado de los neandertales que solo se identificó en los individuos de origen europeo. Además, la investigación identificó 18 regiones del genoma que influyen en el tamaño y la forma de diferentes grupos de dientes, 17 de las […]
    Pablo Javier Piacente / T21
  • El calentamiento global marcó un nuevo récord en 2024 y no detiene su avance 10 enero, 2025
    2024 fue el año más cálido registrado en el mundo y el primero en el cual la temperatura media global superó en 1,5 grados Celsius los niveles previos a la Revolución Industrial. Ya hemos alcanzado el tope máximo fijado en el Acuerdo de París para limitar el calentamiento global.
    Pablo Javier Piacente / T21
  • Los átomos de nuestros cuerpos se comportan como viajeros cósmicos en movimiento 10 enero, 2025
    Gran parte de los átomos de carbono que componen nuestros cuerpos abandonaron la Vía Láctea en una "cinta transportadora cósmica" mucho antes de nuestros nacimientos, según indica un nuevo estudio. La investigación sugiere que la mayoría de los átomos del cuerpo humano probablemente pasaron parte de su existencia a la deriva más allá de la […]
    Redacción T21
  • La IA terminará próximamente con los motores de búsqueda tal como los conocemos 9 enero, 2025
    Nuestra experiencia cotidiana con relación a las búsquedas en Internet sufrirá un cambio radical en los próximos años: la IA modificará los parámetros fijados por Google sobre la década de 1990 y entregará un contenido más personalizado, resumido y trabajado que exigirá un menor esfuerzo por parte de los usuarios, integrando además herramientas de voz […]
    Pablo Javier Piacente / T21
  • Una superbacteria podría solucionar nuestros problemas para vivir en otros mundos 9 enero, 2025
    La superbacteria Deinococcus radiodurans es capaz de sobrevivir a 28.000 veces la dosis letal para un humano de la radiación espacial existente en Marte: podría motivar el desarrollo de antioxidantes sintéticos capaces de ayudar a proteger a los astronautas de la radiación durante las misiones de larga duración al espacio profundo o el establecimiento de […]
    Pablo Javier Piacente / T21
  • Mundos “imposibles” descubiertos bajo el mar extrañan a los expertos 9 enero, 2025
    Los científicos han identificado áreas en el manto inferior terrestre donde las ondas sísmicas se comportan de manera diferente a lo que se suponía anteriormente. Esto sugiere la presencia de zonas de rocas que son más frías, o tienen una composición diferente, que las rocas circundantes. Los hallazgos desafían la comprensión actual sobre la tectónica […]
    Pablo Javier Piacente / T21
  • Descubren en una caverna prehistórica el mapa 3D más antiguo del mundo 9 enero, 2025
    En una pequeña caverna al sur de París, los científicos han descifrado lo que podría ser el mapa tridimensional más antiguo que sobrevive de un territorio de cazadores-recolectores: se habría confeccionado hace unos 40.000 años y representaría la geografía de la región que incluye a la cueva francesa.
    Redacción T21
  • 2025: ¿el año en el que la desinformación en las plataformas tendrá vía libre? 8 enero, 2025
    Al anunciar esta semana que Facebook ponía fin, por el momento en Estados Unidos, a la financiación de organizaciones dedicadas a la verificación de datos, Mark Zuckerberg destacó su deseo de no disgustar al nuevo presidente Trump. Pero también señaló que en las redes sociales la moderación de contenidos falsos o francamente tóxicos está en declive […]
    Pascal Lapointe/Science-Presse/T21
  • Una cuarta parte de la fauna de agua dulce está en peligro de extinción 8 enero, 2025
    Un estudio global analiza la probabilidad de extinción de múltiples especies relacionadas con los ecosistemas de agua dulce y los entornos forestales y humedales interiores, desde los trópicos a las zonas polares: luego de analizar las condiciones de más de 23.000 especies en esos contextos, concluye que alrededor del 24% de las mismas están en […]
    Pablo Javier Piacente / T21