Tendencias21

Crean una herramienta informática capaz de formular hipótesis

Estar al día en el campo de la biomedicina actualmente es una tarea prácticamente imposible, ante la constante aparición de publicaciones que revelan nuevos datos significativos o que refutan los anteriores. Con el objetivo de acelerar el proceso de los investigadores, un equipo de la Universidad de Cambridge, en el Reino Unido, liderado por la doctora Korhonen, ha puesto en marcha un sistema informático capaz de rastrear información a través de los artículos, de la misma forma que lo haría un científico.

Bajo el nombre de CRAB, esta herramienta es capaz de leer cientos de publicaciones para descubrir nuevos conocimientos, evaluar la calidad de la información en busca de patrones y conexiones entre los hechos, e incluso generar sus propias hipótesis a partir de estos datos. Aunque de forma autónoma no sería capaz de acelerar el proceso que sigue cualquier descubrimiento científico, dada su capacidad de considerar un gran número de factores sí que podría revelar información que pasara desapercibida para el cerebro humano.

Según explica la Universidad de Cambridge en un comunicado, este estudio forma parte de un proyecto más amplio de investigadores de Lenguaje Natural y del Grupo de Procesamiento de la Información del Laboratorio de Informática de la Universidad cuyo fin es el desarrollo de ordenadores que puedan entender el lenguaje escrito de la misma manera que lo hacen los humanos.

En este caso, el equipo liderado por la doctora Korhonen ha puesto en marcha un método basado en la tecnología conocida como minería de texto, un campo en desarrollo de la informática que descubre nuevos conocimientos mediante la extracción automática de información de textos escritos. Su aplicación sin embargo es la primera que integra dicha tecnología en una herramienta destinada a la revisión de publicaciones sobre la evaluación de riesgos para la salud.

Sustancias químicas y el cáncer

La cantidad de pruebas científicas que demuestran un fuerte vínculo entre los productos químicos y la probabilidad de desarrollar cáncer determina la necesidad de adoptar medidas urgentes para fijar los límites de exposición a estas sustancias. Para ello se han establecido complejos procedimientos de evaluación de riesgo de cáncer aunque, como destaca la doctora Korhone, es un proceso largo.

Según la directora del proyecto, “la primera etapa de una evaluación de riesgo es una revisión de las publicaciones, lo que supone un importante cuello de botella, pues podría haber decenas de miles de artículos de un solo producto químico. Hacerlo de forma manual es caro y, por el creciente número de publicaciones, se está haciendo demasiado difícil de abarcar».

Sirva como ejemplo que la MEDLINE, la Biblioteca Nacional de Medicina de Estados Unidos, incluye más de 19 millones de discos y suma 4.000 nuevos registros al día sólo en el campo biomédico. De ahí la importancia de CRAB para eliminar la fase manual.

La base de esta herramienta, financiada por los Consejos de investigación británico y sueco, entre otros, es una taxonomía que especifica la evidencia científica utilizada en la evaluación del riesgo de cáncer, incluyendo los acontecimientos clave que pueden dar lugar a su desarrollo. El sistema toma el contenido textual de cada publicación relevante del MEDLINE y la clasifica de acuerdo a la taxonomía.

Con solo pulsar un botón se construye rápidamente un perfil sobre cada sustancia química analizada, en base a todas las publicaciones disponibles, describiendo patrones muy específicos de las conexiones entre dichos productos y la toxicidad.

En fase experimental

Aunque CRAB todavía está en desarrollo, sus creadores consideran que el sistema es capaz de realizar conexiones que serían difíciles de encontrar por el hombre, incluso si le hubiera sido posible leer todos los documentos.

En concreto, según la doctora Korhonen, “en un experimento reciente se estudió un grupo de sustancias químicas con un modo de acción desconocido y la herramienta CRAB sugirió una nueva hipótesis que podría explicar sus riesgos concretos en el desarrollo de cáncer de páncreas en los hombres”.

Esta relevante aplicación informática quedará a disposición de los usuarios una vez concluya la fase experimental a través de una interfaz web online. Sin embargo, el equipo de trabajo continuará la investigación para mejorar la minería de texto. Uno de los mayores retos actuales es el desarrollo de tecnologías adaptativas que puedan ser trasladadas fácilmente entre distintos tipos de texto, tareas y campos científicos.

Con independencia de su uso en el ámbito de la ciencia, CRAB puede entenderse también como una novedosa herramienta basada en el procesamiento de lenguajes naturales, una subdisciplina de la Inteligencia Artificial. Al igual que Siri, el recién estrenado software asistente personal del IPhone 4S, el sistema permite a los ordenadores leer un texto y entender el significado, a pesar de su complejidad, contradicciones o ambigüedades, como si de un humano se tratara.