Tendencias21

Los “análisis de opinión” para Internet se vuelven más profundos

Los últimos avances en ‘análisis de opinión’ revelan una tendencia hacia un análisis de contenido más profundo y orientado a estructuras más amplias distribuidas en tres niveles: léxico, oracional y discursivo. Esto implica no solo traspasar el punto de inflexión hacia una segunda generación de herramientas para el análisis de opinión, sino también entrar en una nueva era del análisis de contenido en la Red. Por Antonio Moreno Sandoval.

Los “análisis de opinión” para Internet se vuelven más profundos

Históricamente las organizaciones e instituciones han centrado gran parte de sus esfuerzos e intereses en conocer la opinión de los usuarios sobre sus productos, servicios o marcas.

Hasta hace relativamente poco, la manera de conocer esa información era a través de encuestas y estudios de mercado, sin embargo estos medios adolecían de una escasa inmediatez. Hoy en día, esa información se obtiene directamente de la Red, lo que implica que se recibe con mayor rapidez y espontaneidad, pero también con una acusada ausencia de organización y estructura de los datos vertidos.

Las primeras aplicaciones comerciales dedicadas al análisis de contenido, opinión y sentimiento de los comentarios vertidos en Internet datan de 2008 —su desarrollo teórico había comenzado mucho antes, hace ya 15 años— y consistían en un análisis superficial a partir de una monitorización básica. A día de hoy, el análisis de la información de las redes sociales ha evolucionado y presenta dos tendencias principales:

Monitorización. En primer lugar tenemos la monitorización. Las empresas pueden utilizar herramientas para escuchar lo que se dice sobre su marca, ya sea desde su página oficial, las redes sociales como Facebook, Twitter o los blogs.

Por un lado, es evidente que a mayor cobertura (número de canales monitorizados), mayor cantidad de información se puede obtener, pero también mayor cantidad de «ruido», pues el volumen de datos no relevantes se incrementa.

Por otro lado, obtenemos una precisión (porcentaje de acierto de las valoraciones) bastante pobre, puesto que el contenido se mide únicamente a través de valoraciones de «positivo/negativo», o mediante la detección de palabras clave. Además, en muchas ocasiones, detectar estas palabras presenta la limitación de que no están incluidas en los diccionarios desarrollados por los lingüistas para la herramienta, y solo ellos pueden incorporarlas, no el usuario.

Para compensar esta falta de precisión, algunas empresas están incorporando de forma progresiva aspectos complementarios, como presentaciones gráficas mejoradas en forma de dashboards (cuadros de control), herramientas para generar informes, configuraciones de alertas para la detección rápida de crisis de marca, o búsquedas parametrizadas, con el objetivo de hacer la herramienta más flexible y adaptable a posibles contingencias.

Con todo, estos complementos, pese a ser funcionalidades muy apreciadas por los responsables de comunicación y marketing, se limitan a un nivel léxico muy básico. A lo sumo, consiguen hacer un análisis de contenido superficial, basado en las interacciones en la red. Esto proporciona información sobre los usuarios y sus relaciones, pero ofrece un análisis semántico todavía muy limitado.

Análisis de contenido. Aquí es donde surge la segunda generación o segunda tendencia del mercado en lo que a análisis de opinión se refiere: el análisis de contenido. El enfoque hacia el análisis semántico está evolucionando de la mera medición de mensajes positivos, negativos y neutros (polaridad de los mensajes) a la detección de tendencias de compra o de temas relevantes para los medios de comunicación.

El análisis de contenido está sujeto a la evaluación de la cobertura, entendida como el número de menciones relevantes de una marca, más la evaluación de la precisión con que se mide el acierto en dicho análisis.

Con respecto a la cobertura, esta depende del número de canales monitorizados y de la capacidad para no perder dichas menciones. Pero, como ocurría con la primera generación, relativa a la monitorización, a mayor cobertura, mayor generación de ruido.

Avances en la precisión

En cuanto a la precisión, el análisis de contenido presenta todavía grandes desafíos. Mensajes ambiguos que pueden tener diferentes interpretaciones o factores lingüísticos como la ironía o el uso figurado hacen que el acierto no sea del 100%.

Alcanzar este porcentaje implica no solo seleccionar mensajes apropiados para ese tipo de búsquedas ambiguas, sino también aplicar filtros que requieren destreza y habilidad para usar la herramienta, lo que en la práctica puede restarles utilidad.

Aun así, se están produciendo grandes avances respecto a los problemas de precisión, a través de mejoras en el motor de análisis semántico, centrándose no solo en el nivel léxico sino también en el oracional y en el discursivo.

Para entender el contenido al completo es necesario realizar un análisis en los sucesivos niveles. El acierto en la interpretación dependerá de forma decisiva de contar con módulos especializados que traten los tres aspectos semánticos.

La tecnología que se esconde detrás del análisis de contenido trata de superar dos grandes paradigmas, uno relacionado con recursos léxicos y, otro, con técnicas de aprendizaje automático.
Por una parte, en lo que respecta a los recursos léxicos, basados en búsquedas de palabras que tengan asignadas alguna polaridad, surge de nuevo la limitación que se encontraba en la monitorización: no pueden analizarse los mensajes cuyas palabras no estén incluidas en los diccionarios de la herramienta.

Por otra parte, las aplicaciones basadas en aprendizaje automático usan modelos que están entrenados con ejemplos analizados por personas que anotan su valor como positivo o negativo. Sin embargo, requieren una actualización constante de datos etiquetados, ya que el lenguaje y el vocabulario utilizados varían de un medio a otro, o entre diferentes dominios temáticos.

Hacia dónde vamos

En la actualidad hay una clara conciencia de que los sistemas de análisis de opinión de primera generación han llegado a un punto donde ya no se puede avanzar más, lo que impide la posibilidad de futuras mejoras.

No es cuestión de permitir al usuario "entrenar" nuevos datos o incluir nuevas entradas al diccionario. Sencillamente hay que abordar ese procesamiento en tres niveles; es decir, avanzar hacia una tecnología semántica profunda que no esté centrada en las palabras, sino en estructuras más amplias.

Asimismo, se debe apostar por «nubes de palabras» más ricas, que agrupen términos más complejos y que, además, se relacionen con otras entidades y personas, ya que el objetivo es tratar de ayudar a descubrir el significado oculto mediante las interrelaciones conceptuales.

Todo ello, además, debe ir integrado dentro de una herramienta sencilla de usar, que permita generar informes gráficos atractivos y proporcione acceso directo a los mensajes. Ha empezado la nueva era del análisis de contenido en la Red.

Sobre el autor

Antonio Moreno Sandoval es Investigador senior del grupo Social Business Analytics en el Instituto de Ingeniería del Conocimiento (IIC) y profesor titular de la Universidad Autónoma de Madrid (UAM) en el Área de Lingüística General de la Facultad de Filosofía y Letras.

Es director del Laboratorio de Lingüística Informática e investigador principal de dicho grupo de investigación reconocido por la UAM. Asimismo ha ejercido como investigador en el Centro Científico de IBM España, en la New York University y en la Cátedra de Lingüística de la Universität Augsburg.

Referencias bibliográficas:

B. Pang y L. Lee. Opinion Mining and Sentiment Analysis. Foundations and Trends in Information Retrieval (2008). DOI: 10.1561/1500000011.

L. Zhang, R. Ghosh, M. Dekhil, M. Hsu, y B. Liu: Combining Lexicon-based and Learning-based Methods for
Twitter Sentiment Analysis
. Hewlett-Packard Labs Technical Report (2011).

B. Liu. Sentiment Analysis and Opinion Mining. Morgan & Claypool Publishers (2012).

E. Cambria, B. Schuller, Y. Xia y C. Havasi: New Avenues in Opinion Mining and Sentiment Analysis. IEEE Intelligent Systems (2013). DOI: 10.1109/MIS.2013.30.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • Revelan por accidente un mundo perdido de 280 millones de años de antigüedad en los Alpes italianos 20 noviembre, 2024
    Una mujer que caminaba por los Alpes italianos descubrió accidentalmente un fragmento de un ecosistema de 280 millones de años de antigüedad: se trata de un mundo perdido y desconocido absolutamente completo, que incluye huellas de animales prehistóricos, fósiles de plantas e incluso rastros de gotas de lluvia, según confirmaron los investigadores.
    Pablo Javier Piacente
  • Una IA puede detectar enfermedades más rápido y mejor que los humanos 20 noviembre, 2024
    Un nuevo modelo de aprendizaje profundo, un enfoque especializado de Inteligencia Artificial (IA), permite detectar enfermedades mediante el reconocimiento y análisis de imágenes médicas en un par de semanas, un proceso que podría tomar un año o más si es realizado por especialistas humanos. Además de la rapidez, las pruebas realizadas muestran que la IA […]
    Pablo Javier Piacente
  • Descubren que las células pueden aprender 20 noviembre, 2024
    Los científicos sugieren que las células individuales parecen ser capaces de un tipo básico de aprendizaje, típicamente asociado con sistemas nerviosos completos, según una nueva investigación. Los especialistas sostienen que las células pueden desarrollar la habituación, un comportamiento que reduce la respuesta a un estímulo cuando el mismo se reitera: aún no logran explicar cómo […]
    Redacción T21
  • La IA ya está ocupando puestos de trabajo 19 noviembre, 2024
    Desde el auge de la Inteligencia Artificial (IA), y más aún luego de la popularización de ChatGPT y otras aplicaciones de chatbot, la demanda de algunas especialidades laborales relacionadas con la creación de contenidos, la programación o la entrada de datos ha sufrido un importante descenso, según un nuevo estudio. Los resultados confirman que se […]
    Pablo Javier Piacente
  • Crean robots con visión sobrehumana 19 noviembre, 2024
    Un nuevo sistema convierte ondas de radio en imágenes 3D, permitiendo a los robots contar con una visión que supera ampliamente a la humana: logran ver con nitidez en condiciones de niebla, humo o escasa luminosidad, entre otros desafíos que les proponga el entorno. Además, un enfoque centrado en el aprendizaje automático les permite progresar […]
    Pablo Javier Piacente
  • Tenemos que asumir la cultura de la emergencia porque el clima del Holoceno ya no existe 19 noviembre, 2024
    Tres semanas después de la trágica DANA de Valencia, es el momento de tomar decisiones y de considerar la posibilidad de abandonar las zonas inundables, de emigrar a espacios más seguros porque el clima del Holoceno ya no existe. Hemos entrado en un clima nuevo, el Antropoceno, por decenas o centenas de miles de años, […]
    Alejandro Sacristán
  • Una nueva técnica para imprimir el ADN podría revolucionar el almacenamiento de datos 19 noviembre, 2024
    Una metodología desarrollada por un equipo de científicos para escribir datos en ADN funciona como una imprenta y hace que sea más sencillo almacenar datos en el código genético, una alternativa que supera ampliamente a los sistemas tradicionales y podría dejar atrás los graves inconvenientes de acumulación de información que atravesamos actualmente.
    Redacción T21
  • Un videojuego puede eliminar los pensamientos negativos 18 noviembre, 2024
    Un nuevo estudio demuestra la efectividad de una aplicación gamificada para aliviar los síntomas de depresión, al romper los patrones de pensamiento negativo: según los investigadores, los participantes en el estudio experimentaron una reducción sustancial de los síntomas depresivos luego de probar la aplicación de minijuegos interactivos.
    Pablo Javier Piacente
  • El telescopio Webb revoluciona por completo nuestra comprensión del Universo primitivo 18 noviembre, 2024
    Utilizando el Telescopio Espacial James Webb para mirar atrás en el tiempo, hacia los confines más lejanos del Universo, los astrónomos han hallado evidencias sorprendentes de una teoría alternativa de la gravedad y de la formación de las galaxias. En un nuevo estudio, sugieren que las observaciones del telescopio Webb indican que las estructuras en […]
    Pablo Javier Piacente
  • Descubren que la luz puede proyectar sombras sin objetos que se interpongan 18 noviembre, 2024
    En un hallazgo claramente contraintuitivo, un equipo de científicos demostró que un rayo láser a veces puede actuar como un objeto sólido y proyectar una sombra que es visible a simple vista. Los investigadores pudieron revelar que el haz estrecho de un láser, en condiciones específicas, puede proyectar una sombra al interactuar con otro haz […]
    Redacción T21