Tendencias21

Un sistema analiza sin ambigüedades grandes cantidades de textos de Internet

Científicos de Alemania han desarrollado una tecnología de búsqueda y análisis de cantidades muy grandes de textos de redes sociales y medios de comunicación en línea, que elimina ambigüedades de significado, y que está especialmente destinada a empresas que quieren conocer su reputación y la de sus productos. En EE.UU., por su parte, han utilizado una tecnología similar para rastrear el origen de intoxicaciones alimentarias en Twitter. Por Carlos Gómez Abajo.

Un sistema analiza sin ambigüedades grandes cantidades de textos de Internet

Los portales de noticias y las redes sociales son ricas fuentes de información, por ejemplo para predecir las tendencias del mercado de valores. Muchos proveedores de servicios permiten rastrear grandes colecciones de textos introduciendo en sus motores de búsqueda palabras clave descriptivas, que tienden a ser muy ambiguas, sin embargo, y muestran rápidamente los límites de las tecnologías de búsqueda actuales.

Científicos de la computación de la Universidad del Sarre (Alemania) han desarrollado una nueva tecnología de análisis de textos que mejora considerablemente la búsqueda en colecciones de texto muy grandes por medio de la inteligencia artificial. Más allá de las búsquedas, esta tecnología también ayuda a investigar e incluso en la escritura de textos, proporcionando automáticamente información de contexto y sugiriendo enlaces a sitios web de interés.

Ambiverse, una empresa spin-off del Instituto Max Planck de Informática de Saarbrücken, presentará esta nueva tecnología durante la feria de tecnología CeBIT 2016, que se celebrará en Hannover del 14 al 18 de marzo.

En la era de los teléfonos inteligentes y las salas de chat, la información en las empresas no se distribuye a través de palabras habladas, sino más bien a través de correos electrónicos, bases de datos y portales de noticias internas.

«De acuerdo con una encuesta realizada por la empresa de análisis de mercado Gartner, apenas un cuarto de todas las empresas están utilizando métodos automáticos para analizar su información textual. Para 2021, Gartner predice que lo hará el 65 por ciento. Esto se debe a que la cantidad de datos dentro de las empresas está en continuo crecimiento y, por tanto, se hace más y más costoso tenerlos estructurados y rastrearlos con éxito», dice Johannes Hoffart, investigador del Instituto Max Planck de Informática y fundador de Ambiverse.

Su equipo ha desarrollado una nueva tecnología para el análisis de grandes cantidades de texto, en la que la inteligencia artificial está continuamente «pensando en voz alta» al fondo.

«Para el análisis de los textos, nos basamos en conjuntos extremadamente grandes de conocimiento construidos a partir de fuentes de libre acceso como Wikipedia o grandes portales multimedia de la web. Estos conjuntos pueden crecer con conocimiento específico de la empresa o del ámbito de actuación, tales como catálogos de productos o correspondencia de los clientes», dice Hoffart en la nota de prensa de la universidd, recogida por AlphaGalileo.

Mediante la aplicación de algoritmos complejos, estos textos son examinados y analizados con herramientas lingüísticas. «Nuestro software asigna entonces las empresas y áreas de negocio a las categorías correspondientes, lo cual nos permite reunir información valiosa sobre cómo de bien posicionados en el mercado están sus productos en comparación con los de los competidores», explica. Un reto especialmente difícil es el hecho de que los nombres de productos y empresas son de todo menos únicos y tienden a tener significados completamente diferentes en diferentes contextos, lo que los hace muy ambiguos.

Ambigüedad

«Nuestra tecnología ayuda a asignar palabras y frases a los objetos correctos del mundo real, resolviendo las ambigüedades de forma automática», explica el científico de la computación. París, por ejemplo, no solo representa la ciudad de la luz y la capital francesa, sino también una figura de la mitología griega o una conocida chica con antepasados ​​alemanes, siempre según el contexto.

«La búsqueda eficiente de enormes colecciones de texto sólo es posible si los diferentes significados de un nombre o un concepto están resueltos correctamente», dice Hoffart. El motor de búsqueda inteligente desarrollado por su equipo aprende de forma continua y mejora con el tiempo, y también asocia automáticamente nuevas entradas de texto a categorías similares. «Estos algoritmos son, por tanto, atractivos para las empresas que analizan las redes sociales o los medios de comunicación en línea para medir el grado de conocimiento de la marca de un producto o el éxito de una campaña de marketing», añade el investigador.

En CeBIT, Ambiverse presentará además una plataforma de creación inteligente que ayuda a los autores a investigar y escribir textos. Los usuarios introducen textos y reciben automáticamente información de contexto: por ejemplo, guías y manuales internos de la empresa o enlaces de Internet.

Los visitantes al stand de Ambiverse en CeBIT también tendrán la oportunidad de competir con su novedosa tecnología de inteligencia artificial, jugando a un juego de preguntas y respuestas.  Ambiverse está financiada por el Ministerio alemán de Economía.

Intoxicaciones en tuits

La tecnología de lenguaje natural permite utilizar las redes sociales para usos de lo más variado, como encontrar fuentes de intoxicación alimentaria. Investigadores de la Universidad de Rochester (Nueva York, EE.UU.) han desarrollado una aplicación que utiliza el procesamiento del lenguaje natural y la inteligencia artificial para identificar tuits relacionados con intoxicaciones alimentarias, conectarlos a los restaurantes usando geoetiquetado e identificar probables puntos conflictivos.

Según informa Dail Software, los investigadores han mostrado que es posible deducir el origen de los brotes usando el contenido público de las redes sociales y algoritmos de aprendizaje profundo entrenados para reconocer rasgos lingüísticos asociados con una enfermedad: “Siento náuseas”, por ejemplo.

En un artículo, los investigadores describen su colaboración con el departamento de salud de Las Vegas, cuyos funcionarios utilizaron la aplicación llamada nEmesis para mejorar los protocolos de inspección de la ciudad.

Normalmente, las ciudades (como Las Vegas) utilizan un sistema aleatorio para decidir qué restaurantes inspeccionar en cualquier día dado. El equipo de investigación convenció a los funcionarios de Las Vegas para reemplazar su sistema aleatorio con una lista de posibles sitios de infección derivada de sus algoritmos inteligentes.

En un experimento controlado, la mitad de las inspecciones se realizaron utilizando el enfoque al azar y la otra mitad se realizaron utilizando nEmesis, sin que los inspectores supieran de que se había cambiado el sistema.

Durante tres meses, el sistema escaneó automáticamente un promedio de 16.000 tuits de 3.600 usuarios cada día. 1.000 de los tuits estaban relacionados con un restaurante específico y de ellos, aproximadamente 12 incluían contenido que probablemente significaba una intoxicación alimentaria.

Analizando los resultados del experimento, encontraron que el sistema basado en tuits llevó a un 15 por ciento de citaciones por infracciones sanitarias respecto al total de inspecciones, en comparación con el 9 por ciento del sistema aleatorio. Algunas de las inspecciones acabaron en advertencias; otras, en cierres.

Los investigadores estiman que estas mejoras en la eficacia de las inspecciones dieron lugar a 9.000 menos incidentes de envenenamiento por alimentos y 557 menos hospitalizaciones en Las Vegas durante el estudio.

Referencia bibliográfica:

Adam Sadilek, Henry Kautz, Lauren DiPrete, Brian Labus, Eric Portman, Jack Teitel y Vincent Silenzio: Deploying nEmesis: Preventing Foodborne Illness by Data Mining Social Media.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Crean el primer mapa completo de las combinaciones del ADN humano 24 enero, 2025
    En un importante avance en el campo de la genética, un equipo científico ha creado el primer mapa completo de cómo el ADN humano de dos padres se mezcla en la descendencia: comprender en profundidad las combinaciones del ADN puede permitir un gran salto adelante en el entendimiento de la diversidad genética y su relación […]
    Pablo Javier Piacente / T21
  • La IA reduce de dos años a seis semanas los tiempos del aprendizaje 24 enero, 2025
    Un programa piloto en Nigeria logró condensar los contenidos que reciben los estudiantes en dos años en solo seis semanas, empleando herramientas de Inteligencia Artificial (IA): además de la reducción en los tiempos de aprendizaje, logró actualizar contenidos y borrar brechas de género en sitios donde la falta de docentes calificados, la ausencia de materiales […]
    Pablo Javier Piacente / T21
  • Nuevas evidencias confirman la presencia de antiguos lagos y cuerpos de agua líquida en Marte 24 enero, 2025
    Imágenes tomadas por el rover Curiosity de la NASA muestran firmas geológicas de antiguos lagos y estanques de agua líquida en Marte, que habrían estado abiertos al aire marciano y sin agua congelada. Los especialistas indican que los rastros en forma de ondas que muestran los viejos cursos de agua se formaron hace unos 3,7 […]
    Pablo Javier Piacente / T21
  • Los microplásticos bloquean el flujo sanguíneo en el cerebro 24 enero, 2025
    Un estudio realizado en roedores ha desvelado un mecanismo a través del cual los microplásticos que se incorporan al torrente sanguíneo tienen la capacidad de generar trombos u obstrucciones en el cerebro: además de la incidencia negativa de estos coágulos, que tienen el potencial de provocar un accidente cerebrovascular (ACV) al bloquear el flujo sanguíneo […]
    Redacción T21
  • Las misteriosas ráfagas de radio rápidas podrían nacer en galaxias antiguas y muertas 23 enero, 2025
    Los astrónomos están dejando atrás la idea de que las ráfagas de radio rápidas (FRB) emanan únicamente de regiones de formación estelar activa o galaxias jóvenes: nuevas evidencias observacionales sugieren que los orígenes de estos enigmáticos eventos cósmicos podrían ser más diversos, incluyendo incluso a galaxias antiguas y sin actividad.
    Pablo Javier Piacente / T21
  • Un enorme objeto interestelar modificó para siempre a nuestro Sistema Solar 23 enero, 2025
    Un estudio sugiere que es posible que un objeto de origen interestelar de enorme tamaño y peso se introdujera en el Sistema Solar al principio de su formación, dejando una huella imborrable en las órbitas planetarias, antes de desviarse nuevamente hacia otros confines del Universo. El visitante fugaz podría haber tenido características similares al misterioso […]
    Pablo Javier Piacente / T21
  • ¿Fue la Edad del Hierro un período histórico matriarcal? 23 enero, 2025
    Genetistas y arqueólogos han descubierto a través del análisis de ADN antiguo evidencia convincente que sugiere que la Edad del Hierro de Gran Bretaña puede haber sido aún más matriarcal de aquello que se pensaba anteriormente: las tierras se transmitían a la descendencia femenina, por ejemplo, siendo la primera vez que se documenta este tipo […]
    Redacción T21
  • Doctor Manuel Corpas: un viaje alucinante a través de la Genómica y la Bioinformática 23 enero, 2025
    El científico español Manuel Corpas ha sido pionero en compartir en Internet la base genética de su familia con la finalidad de descubrir hasta qué punto los genomas influyen en nuestras elecciones de vida. Ahora está construyendo una red internacional de investigación en torno a los genomas de diversidad latinoamericanos para descubrir cómo la migración […]
    Alejandro Sacristán/T21
  • Tendremos un futuro utópico y distópico a la vez 23 enero, 2025
    La nueva edición de la exposición ArtFutura, que se desarrolla en el Palacio Neptuno de Madrid, transmite un mensaje claro: la Inteligencia Artificial Generativa no es una amenaza para el arte, sino una nueva herramienta que expande los límites de nuestra creatividad. Sin miedo.
    Alejandro Sacristán (enviado especial T21)
  • El cambio climático está "atrapando" a algunas bacterias en un bucle temporal eterno 22 enero, 2025
    Especies de bacterias en un lago de Wisconsin están en una suerte de "bucle interminable" evolutivo: han crecido rápidamente y regresado abruptamente a su estado inicial, repitiendo una y otra vez ese ciclo, aparentemente en respuesta a estaciones y otros parámetros ambientales que cambiaron drásticamente como consecuencia del cambio climático.
    Pablo Javier Piacente / T21