Tendencias21

Proyectan un programa informático que detecta las opiniones

El Gobierno norteamericano ha concedido a un consorcio de tres universidades 2,4 millones de dólares para trabajar sobre un sistema informático capaz de extraer, resumir y rastrear información acerca de hechos y creencias a partir de un texto libre. La idea es crear patrones capaces de separar las afirmaciones de los hechos y de detectar estados de opinión no manifestados en los textos que circulan por Internet y otros medios. Con este programa se pretende extraer información de artículos, noticias o cualquier tipo de texto, acerca de, por ejemplo, posibles atentados terroristas, accidentes, adquisiciones empresariales o contenidos virtuales. Por Yaiza Martínez.

Proyectan un programa informático que detecta las opiniones

Descubrir las verdaderas intenciones que se ocultan tras el lenguaje corriente es lo que pretende un proyecto de sistema informático que será capaz de extraer, resumir y rastrear información acerca de hechos y creencias a partir de un texto libre, informa la Universidad de Cornell en un comunicado.

Será desarrollado por científicos del Cornell Natural Language Processing Group (NLP de la universidad de Pittsburgh, a partir de tres líneas de investigación, según describe una de sus creadores, Janyce Wiebe, que codirige el NLP con Diane Litman y Rebbeca Hwa.

En primer lugar, los especialistas pretenden generar algoritmos fáciles de manejar que automáticamente puedan crear patrones acerca de un tema concreto, con el fin de identificar fenómenos y vínculos asociados a hechos relevantes, como un atentado terrorista.

Para la seguridad nacional

En segundo lugar, se desarrollarán otros algoritmos que permitan distinguir afirmaciones factuales u objetivas de las aserciones subjetivas o no-factuales. También identificarán creencias acordes con determinadas organizaciones y evaluarán la intensidad, la polarización, la motivación y los tipos de actitudes relacionados con dichas creencias.

Por último, se elaborarán métodos de rastreo de la evolución de creencias y sucesos a lo largo del tiempo. Con este trabajo, se esperan descubrir patrones de actividad, cooperación y convicciones en individuos de distinto tipo y en regiones geográficas diversas.

El proyecto ha sido respaldado económicamente por el Department of Homeland Security (departamento de seguridad nacional) estadounidense, que ha acordado una financiación de 2,4 millones de dólares. En el proyecto, que ha recibido el nombre de "Information Extraction of Events and Beliefs from Text", participarán, además de la universidad de Pittsburg, las universidades de Cornell y de Utah.

Las tres universidades forman uno de los cuatro centros nacionales encargados de trabajar en nuevos métodos de análisis de datos para la seguridad nacional. La metodología para detectar opiniones, emociones y expresiones en el lenguaje ha sido explicada en un artículo de la mencionada universidad.

Intención y fiabilidad

El "Information Extraction of Events and Beliefs from Text" pretende analizar el lenguaje natural utilizando las técnicas clásicas de representación (gráfica sujeto-verbo, por ejemplo) y las relaciones de las palabras en las frases (diferentes palabras o grupos de palabras que se refieren al mismo concepto), así como supervisar el aprendizaje. No se pretenden analizar discursos completos, sino más bien oraciones e incluso sólo palabras.

Las nuevas técnicas, principalmente desarrolladas en la universidad de Pittsburgh, en el NLP, permiten distinguir los enunciados relacionados con las opiniones, rastreando dentro de ellos los componentes asociados a categorías preestablecidas, así como la entonación positiva o negativa de las frases e incluso de cada palabra. Permite asimismo evaluar la fiabilidad de cada enunciado.

Una combinación de ciencia computacional y de lingüística hará posible un sistema de análisis de sentimientos y subjetividad, de semántica léxica, de procesamiento del discurso o de extracción de información a partir del lenguaje, y por métodos empíricos. Para ello, resulta esencial un esquema detallado de anotaciones que definan los componentes clave y las propiedades de la expresión de dichas emociones privadas.

Análisis de la subjetividad

Con este programa informático se pretende extraer información de artículos, noticias o cualquier tipo de texto, acerca de, por ejemplo, posibles atentados terroristas, accidentes, adquisiciones empresariales o páginas web.

La tecnología de análisis lingüístico ha sufrido un enorme despliegue en los últimos años, aunque su eficacia es aún relativamente baja debido, principalmente, a que en los textos o en el lenguaje en general la información contenida suele ser de los dos tipos: objetiva y subjetiva.

El lenguaje subjetivo expresa opiniones, juicios o estimaciones. Es muy común en noticias y páginas web, que se han convertido en la primera fuente de análisis de la mayoría de las aplicaciones de extracción de información a partir de los textos.

El objetivo de la investigación es utilizar el análisis de esa subjetividad para crear un sistema de obtención de información más exacto, así como mejorar las técnicas de extracción de información a partir del análisis de la subjetividad en el lenguaje. Así se espera reconocer ciertos cambios en el tiempo, como por ejemplo, un aumento o disminución del grado de agresividad con que se expresan aquellas personas que pertenecen a grupos de interés, o cualquier modificación en su retórica.

Yaiza Martinez

Hacer un comentario

RSS Lo último de Tendencias21

  • Una extraña y antigua megaestructura acecha bajo el mar Báltico 14 febrero, 2024
    En la bahía alemana de Mecklenburg, a 21 metros de profundidad, los científicos han encontrado una antigua megaestructura que data de la Edad de Piedra, concretamente de hace más de 10.000 años. La estructura, que abarca una longitud de casi un kilómetro y está compuesta por piedras de distintos tamaños, desafía toda explicación natural: los […]
    Pablo Javier Piacente
  • Detectan por primera vez materia oscura en un cúmulo galáctico 14 febrero, 2024
    La materia oscura identificada, detectada indirectamente en un cúmulo conformado por miles de galaxias, podría ayudar a los científicos a comprobar la existencia de una estructura a gran escala que se extiende por todo el Universo: de esta forma, un "andamiaje" de materia oscura atravesaría todo el cosmos y sería el sostén de innumerables galaxias, […]
    Pablo Javier Piacente
  • El primer implante cerebral de Neuralink en un humano está rodeado de misterio 14 febrero, 2024
    Existen dudas sobre si el primer implante cerebral a un humano, anunciado por Elon Musk el 29 de enero, se ha producido realmente, ya que todo está rodeado de falta de transparencia, ausencia de certificación científica, escasos detalles sobre su tecnología, sus métodos y sus resultados.
    Eduardo Martínez de la Fe
  • Descubren un fármaco de animación suspendida que imita la hibernación 14 febrero, 2024
    Descubren un fármaco de "animación suspendida" que imita la hibernación y podría mejorar el trasplante de órganos, asegurar la supervivencia ante lesiones traumáticas y facilitar los viajes espaciales de larga duración.
    Redacción T21
  • La muerte los llama y ellos se juntan 13 febrero, 2024
    Un experimento desarrollado en "granjas de cadáveres" permitió comprobar que la descomposición de cuerpos humanos y de otras especies atrae siempre a las mismas variedades de microorganismos y hongos, sin importar el clima, la estación del año o la ubicación en el globo. Un mejor conocimiento de esta comunidad "universal" de descomponedores permitirá importantes avances […]
    Pablo Javier Piacente
  • Una corriente oceánica fundamental para el equilibrio climático podría anticipar su colapso 13 febrero, 2024
    Los científicos han descubierto una señal de advertencia clave antes que una corriente crucial del Atlántico colapse y sumerja al hemisferio norte en un verdadero caos climático: la Circulación de Vuelco Meridional del Atlántico (AMOC) genera una liberación de calor que ayuda a mantener a Europa, y también en parte a América del Norte, más […]
    Pablo Javier Piacente
  • Toda la biblioteca privada de Darwin ya está disponible en Internet 13 febrero, 2024
    La biblioteca privada de Charles Darwin ha sido completamente reconstruida y está disponible en Internet por primera vez, coincidiendo con el 215 cumpleaños del naturalista. El catálogo, de 300 páginas, contiene 7.400 títulos con un total de 13.000 volúmenes entre libros, escritos y revistas, que están al alcance de todo el mundo sin salir de […]
    Redacción T21
  • El metro de Londres implanta IA para vigilar la red subterránea 13 febrero, 2024
    El metro de Londres ha probado herramientas de vigilancia con IA en tiempo real para detectar posibles situaciones de riesgo o de conflicto y permitir al personal intervenir rápidamente. Detecta comportamientos agresivos e identifica a las personas que se cuelan sin pagar.
    Redacción T21
  • La memoria universal promete revolucionar a la informática 12 febrero, 2024
    La memoria universal podría reemplazar tanto a la RAM como al almacenamiento interno en los ordenadores de uso masivo, brindando una alternativa más rápida y más eficiente a nivel energético. Un nuevo estudio muestra un posible enfoque revolucionario de la memoria universal: empleando un nuevo material denominado GST467, los investigadores apreciaron que la memoria mejora […]
    Pablo Javier Piacente
  • Los relámpagos volcánicos habrían encendido la llama de la vida en la Tierra primitiva 12 febrero, 2024
    Cuando la Tierra era joven y salvaje, los procesos en nuestro planeta transformaron una mezcla de ingredientes en lo necesario para impulsar la vida. Para esto es crucial el nitrógeno, un nutriente esencial para formar proteínas, aminoácidos y ácidos nucleicos. Los científicos han descubierto evidencias geológicas que indican que las descargas de rayos asociadas con […]
    Pablo Javier Piacente