Tendencias21

Un sistema analiza sin ambigüedades grandes cantidades de textos de Internet

Científicos de Alemania han desarrollado una tecnología de búsqueda y análisis de cantidades muy grandes de textos de redes sociales y medios de comunicación en línea, que elimina ambigüedades de significado, y que está especialmente destinada a empresas que quieren conocer su reputación y la de sus productos. En EE.UU., por su parte, han utilizado una tecnología similar para rastrear el origen de intoxicaciones alimentarias en Twitter. Por Carlos Gómez Abajo.

Un sistema analiza sin ambigüedades grandes cantidades de textos de Internet

Los portales de noticias y las redes sociales son ricas fuentes de información, por ejemplo para predecir las tendencias del mercado de valores. Muchos proveedores de servicios permiten rastrear grandes colecciones de textos introduciendo en sus motores de búsqueda palabras clave descriptivas, que tienden a ser muy ambiguas, sin embargo, y muestran rápidamente los límites de las tecnologías de búsqueda actuales.

Científicos de la computación de la Universidad del Sarre (Alemania) han desarrollado una nueva tecnología de análisis de textos que mejora considerablemente la búsqueda en colecciones de texto muy grandes por medio de la inteligencia artificial. Más allá de las búsquedas, esta tecnología también ayuda a investigar e incluso en la escritura de textos, proporcionando automáticamente información de contexto y sugiriendo enlaces a sitios web de interés.

Ambiverse, una empresa spin-off del Instituto Max Planck de Informática de Saarbrücken, presentará esta nueva tecnología durante la feria de tecnología CeBIT 2016, que se celebrará en Hannover del 14 al 18 de marzo.

En la era de los teléfonos inteligentes y las salas de chat, la información en las empresas no se distribuye a través de palabras habladas, sino más bien a través de correos electrónicos, bases de datos y portales de noticias internas.

«De acuerdo con una encuesta realizada por la empresa de análisis de mercado Gartner, apenas un cuarto de todas las empresas están utilizando métodos automáticos para analizar su información textual. Para 2021, Gartner predice que lo hará el 65 por ciento. Esto se debe a que la cantidad de datos dentro de las empresas está en continuo crecimiento y, por tanto, se hace más y más costoso tenerlos estructurados y rastrearlos con éxito», dice Johannes Hoffart, investigador del Instituto Max Planck de Informática y fundador de Ambiverse.

Su equipo ha desarrollado una nueva tecnología para el análisis de grandes cantidades de texto, en la que la inteligencia artificial está continuamente «pensando en voz alta» al fondo.

«Para el análisis de los textos, nos basamos en conjuntos extremadamente grandes de conocimiento construidos a partir de fuentes de libre acceso como Wikipedia o grandes portales multimedia de la web. Estos conjuntos pueden crecer con conocimiento específico de la empresa o del ámbito de actuación, tales como catálogos de productos o correspondencia de los clientes», dice Hoffart en la nota de prensa de la universidd, recogida por AlphaGalileo.

Mediante la aplicación de algoritmos complejos, estos textos son examinados y analizados con herramientas lingüísticas. «Nuestro software asigna entonces las empresas y áreas de negocio a las categorías correspondientes, lo cual nos permite reunir información valiosa sobre cómo de bien posicionados en el mercado están sus productos en comparación con los de los competidores», explica. Un reto especialmente difícil es el hecho de que los nombres de productos y empresas son de todo menos únicos y tienden a tener significados completamente diferentes en diferentes contextos, lo que los hace muy ambiguos.

Ambigüedad

«Nuestra tecnología ayuda a asignar palabras y frases a los objetos correctos del mundo real, resolviendo las ambigüedades de forma automática», explica el científico de la computación. París, por ejemplo, no solo representa la ciudad de la luz y la capital francesa, sino también una figura de la mitología griega o una conocida chica con antepasados ​​alemanes, siempre según el contexto.

«La búsqueda eficiente de enormes colecciones de texto sólo es posible si los diferentes significados de un nombre o un concepto están resueltos correctamente», dice Hoffart. El motor de búsqueda inteligente desarrollado por su equipo aprende de forma continua y mejora con el tiempo, y también asocia automáticamente nuevas entradas de texto a categorías similares. «Estos algoritmos son, por tanto, atractivos para las empresas que analizan las redes sociales o los medios de comunicación en línea para medir el grado de conocimiento de la marca de un producto o el éxito de una campaña de marketing», añade el investigador.

En CeBIT, Ambiverse presentará además una plataforma de creación inteligente que ayuda a los autores a investigar y escribir textos. Los usuarios introducen textos y reciben automáticamente información de contexto: por ejemplo, guías y manuales internos de la empresa o enlaces de Internet.

Los visitantes al stand de Ambiverse en CeBIT también tendrán la oportunidad de competir con su novedosa tecnología de inteligencia artificial, jugando a un juego de preguntas y respuestas.  Ambiverse está financiada por el Ministerio alemán de Economía.

Intoxicaciones en tuits

La tecnología de lenguaje natural permite utilizar las redes sociales para usos de lo más variado, como encontrar fuentes de intoxicación alimentaria. Investigadores de la Universidad de Rochester (Nueva York, EE.UU.) han desarrollado una aplicación que utiliza el procesamiento del lenguaje natural y la inteligencia artificial para identificar tuits relacionados con intoxicaciones alimentarias, conectarlos a los restaurantes usando geoetiquetado e identificar probables puntos conflictivos.

Según informa Dail Software, los investigadores han mostrado que es posible deducir el origen de los brotes usando el contenido público de las redes sociales y algoritmos de aprendizaje profundo entrenados para reconocer rasgos lingüísticos asociados con una enfermedad: “Siento náuseas”, por ejemplo.

En un artículo, los investigadores describen su colaboración con el departamento de salud de Las Vegas, cuyos funcionarios utilizaron la aplicación llamada nEmesis para mejorar los protocolos de inspección de la ciudad.

Normalmente, las ciudades (como Las Vegas) utilizan un sistema aleatorio para decidir qué restaurantes inspeccionar en cualquier día dado. El equipo de investigación convenció a los funcionarios de Las Vegas para reemplazar su sistema aleatorio con una lista de posibles sitios de infección derivada de sus algoritmos inteligentes.

En un experimento controlado, la mitad de las inspecciones se realizaron utilizando el enfoque al azar y la otra mitad se realizaron utilizando nEmesis, sin que los inspectores supieran de que se había cambiado el sistema.

Durante tres meses, el sistema escaneó automáticamente un promedio de 16.000 tuits de 3.600 usuarios cada día. 1.000 de los tuits estaban relacionados con un restaurante específico y de ellos, aproximadamente 12 incluían contenido que probablemente significaba una intoxicación alimentaria.

Analizando los resultados del experimento, encontraron que el sistema basado en tuits llevó a un 15 por ciento de citaciones por infracciones sanitarias respecto al total de inspecciones, en comparación con el 9 por ciento del sistema aleatorio. Algunas de las inspecciones acabaron en advertencias; otras, en cierres.

Los investigadores estiman que estas mejoras en la eficacia de las inspecciones dieron lugar a 9.000 menos incidentes de envenenamiento por alimentos y 557 menos hospitalizaciones en Las Vegas durante el estudio.

Referencia bibliográfica:

Adam Sadilek, Henry Kautz, Lauren DiPrete, Brian Labus, Eric Portman, Jack Teitel y Vincent Silenzio: Deploying nEmesis: Preventing Foodborne Illness by Data Mining Social Media.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • El contacto con la naturaleza cambia nuestra percepción del tiempo 28 marzo, 2024
    Investigaciones recientes y en particular un nuevo estudio han demostrado que la naturaleza puede regular nuestro sentido del tiempo: estar en ámbitos naturales puede cambiar la forma en que experimentamos el tiempo y, tal vez, brindarnos la sensación de abundancia de tiempo que las exigencias de la vida contemporánea suelen reducir drásticamente.
    Pablo Javier Piacente
  • El derretimiento de los polos modifica la velocidad a la cual gira la Tierra 28 marzo, 2024
    Un nuevo estudio ha descubierto que la redistribución de la masa procedente del derretimiento del hielo polar está cambiando la velocidad a la que gira nuestro planeta. No se trata de algo anecdótico, ya que modifica la duración del año en la Tierra: los cambios han derivado en que el segundo intercalar previsto para restar […]
    Pablo Javier Piacente
  • Descubren el primer hogar del Homo Sapiens fuera de África 28 marzo, 2024
    El primer hogar que acogió al Homo Sapiens cuando emigró de África fue la así llamada Meseta Persa, donde vivió unos 20.000 años e interactuó con los neandertales hasta que oleadas de estas poblaciones se dispersaron y se asentaron por toda Eurasia.
    Redacción T21
  • Los astrónomos observan un misterioso glóbulo cometario vagando por el cosmos 27 marzo, 2024
    Utilizando el Telescopio de rastreo VLT (VST) los científicos han producido una imagen impactante de GN 16.43.7.01, un glóbulo cometario situado a 5.000 años luz de distancia de la Tierra, en la constelación de Escorpio. Se trata de pequeñas y débiles nubes interestelares de gas y polvo cósmico, con una forma similar a la de […]
    Pablo Javier Piacente
  • Sería inminente el hallazgo de vida extraterrestre en Europa, una de las lunas de Júpiter 27 marzo, 2024
    Basado en experimentos recientes, un grupo de científicos determinó en un nuevo estudio que un instrumento en particular a bordo de la futura misión Europa Clipper de la NASA, denominado SUrface Dust Analyzer, era tan sensible que probablemente podría detectar signos de vida extraterrestre en granos individuales de hielo expulsados por Europa, la luna helada […]
    Pablo Javier Piacente
  • ¿La criopreservación es el paso necesario para la resurrección moderna? 27 marzo, 2024
    En España hay cinco casos de personas sometidas a criopreservación después de fallecer, a la espera de que la tecnología permita, tal vez, volverlos a la vida en los años 50 de este siglo.
    José Luis Cordeiro (*)
  • Crean un cerebro fantasma en forma de cubo impreso en 3D 27 marzo, 2024
    Investigadores austriacos han desarrollado un modelo de cerebro impreso en 3D basado en la estructura de las fibras cerebrales visibles mediante imágenes de resonancia magnética. Permite estudiar la compleja red neuronal con una precisión sin precedentes.
    Redacción T21
  • El océano se está desgarrando 26 marzo, 2024
    2.000 terremotos en un día en Canadá insinúan el nacimiento de una nueva corteza oceánica frente a la costa de la isla de Vancouver: está a punto de nacer a través de una ruptura magmática en las profundidades del mar.
    Pablo Javier Piacente
  • Simulan una explosión termonuclear en un superordenador 26 marzo, 2024
    Una simulación por superordenador nos brinda nuevos conocimientos sobre el comportamiento de las estrellas de neutrones: al evocar la explosión termonuclear que tiene lugar cuando estos monstruos cósmicos devoran a otra estrella, los investigadores logran avanzar en la comprensión de los fenómenos más extremos que suceden en el cosmos.
    Pablo Javier Piacente
  • Las matemáticas tienen la clave para erradicar el machismo 26 marzo, 2024
    Las matemáticas demuestran que si una parte significativa de las mujeres de una población (superando el límite del 45%) se comporta solidariamente con otras mujeres (como si fuesen hermanas), el machismo se extingue.
    Alicia Domínguez y Eduardo Costas (*)