Tendencias21
Una nueva herramienta pone los recursos bioinformáticos de Internet al alcance de todos

Una nueva herramienta pone los recursos bioinformáticos de Internet al alcance de todos

Una innovadora metodología que por primera vez permite el descubrimiento, extracción y clasificación automática de recursos bioinformáticos a partir de la literatura científica especializada en el área, ha sido desarrollada por investigadores de la Facultad de Informática de la Universidad Politécnica de Madrid. El índice de recursos está disponible libremente a través de la aplicación web situada en el servidor.

Una nueva herramienta pone los recursos bioinformáticos de Internet al alcance de todos

Después de la conclusión del Proyecto Genoma Humano, la proliferación de recursos bioinformáticos en los últimos años obliga a los investigadores a tener que dedicar buena parte de su tiempo a buscar estos recursos en la red. El Grupo de Informática Biomédica (GIB) de la Facultad de Informática de la Universidad Politécnica de Madrid (UPM) ha desarrollado una innovadora metodología que, por primera vez, permite el descubrimiento y clasificación automática de recursos bioinformáticos a partir de artículos científicos, informa la citada Facultad en un comunicado.

En la actualidad existen numerosos recursos bioinformáticos on-line disponibles para toda la comunidad científica. Este número sigue creciendo exponencialmente día tras día. En la investigación biomédica, cada vez es más frecuente que los recursos generados por los investigadores —bases de datos, software, recursos de varios tipos— se pongan a disposición de toda la comunidad científica para así acelerar el avance científico. Descubrir, localizar y aprender cómo usar nuevas aplicaciones supone un coste—sobre todo en términos de tiempo—que la gran mayoría de investigadores no pueden asumir. Por ello surge la necesidad de organizar los recursos existentes para facilitar lo más posible estas tareas de búsqueda.

Un equipo de investigadores del GIB de la Facultad de Informática de la UPM (Guillermo de la Calle, Miguel García-Remesal, Diana de la Iglesia y Stefano Chiesa), dirigidos por el catedrático Víctor Maojo, ha desarrollado una innovadora metodología que por primera vez permite el descubrimiento, extracción y clasificación automática de recursos bioinformáticos a partir de la literatura científica especializada en el área. El índice de recursos desarrollado está disponible libremente a través de la aplicación web situada en el servidor.

Procesamiento de Lenguaje Natural

La metodología está basada en técnicas de Procesamiento del Lenguaje Natural e Inteligencia Artificial que permiten la extracción y clasificación automática de información relevante contenida en artículos científicos, principalmente en los abstracts. Cada artículo es analizado morfológica, sintáctica y semánticamente buscando una serie de patrones establecidos, que permiten identificar de manera automática y sin intervención del usuario los nombres, funcionalidad, URL de acceso y, en algunos casos, las entradas y salidas de dichos recursos.

Adicionalmente, los recursos son clasificados atendiendo a dos dimensiones, por un lado el dominio de aplicación (por ejemplo, ADN, ARN o Proteína) y por otro la categoría (funcionalidad/tipo) de recurso (por ejemplo, alineamiento, base de datos o anotación). Para realizar dicha clasificación, se utiliza una taxonomía de dominios y categorías específicamente diseñada con este fin y basada en otras taxonomías ya existentes, por ejemplo BLD – Bioinformatics Links Directory.

Para validar la metodología, el grupo de la UPM realizó un experimento preliminar con 400 artículos indexados en el ISI Web of Knowledge. Se realizó una búsqueda con la cadena «bioinformatics resources», seleccionando los 392 primeros artículos más relevantes de acuerdo con su factor de impacto. El resto eran artículos no relacionados con recursos bioinformáticos, que fueron introducidos como conjunto de control para verificar la robustez del método. De este conjunto se extrajeron automáticamente 376 nombres de recursos, lo que supone un índice de acierto de casi el 95%.

Como trabajo adicional, se ha puesto a libre disposición de la comunidad científica una aplicación web basada en Servicios Web, que permite acceder al índice creado y buscar recursos por el nombre, categoría y dominio.

La principal ventaja del nuevo método frente a los índices de recursos existentes reside en su creación y actualización, tareas que se realizan de forma automática. Dado su carácter genérico, esta metodología se está aplicando en el marco del proyecto europeo ACTION-Grid, la primera iniciativa europea en Grid Computing, Informática Biomédica y Nanoinformática, coordinado por el profesor Víctor Maojo.

Tanto la metodología como los resultados han sido publicados en los congresos y revistas más prestigiosas del sector, como el publicado en BMC Bioinformatics: Guillermo de la Calle, Miguel García-Remesal, Stefano Chiesa, Diana de la Iglesia and Victor Maojo. BIRI: a new approach for automatically discovering and indexing available public bioinformatics resources from the literature. BMC Bioinformatics 2009, 10:320.

Hacer un comentario

RSS Lo último de Tendencias21

  • Crean bebés digitales para mejorar la atención sanitaria infantil 27 junio, 2024
    Un equipo de investigadores desarrolló modelos informáticos que simulan los procesos metabólicos únicos de cada bebé: los “gemelos digitales” pueden ayudar a comprender mejor las enfermedades metabólicas raras y otros desafíos que enfrentan los bebés humanos durante los primeros 6 meses de vida, que son críticos para su crecimiento posterior.
    Pablo Javier Piacente
  • Los vientos espaciales son similares a los que soplan en la Tierra 27 junio, 2024
    Los científicos han descubierto corrientes en el espacio que reflejan de manera inquietante los vientos que giran cerca de la superficie de la Tierra, lo que sugiere fuerzas ocultas que los conectan. Este nuevo conocimiento podría proporcionarnos una mejor comprensión de los sistemas ambientales que circulan alrededor del globo y mejorar los pronósticos meteorológicos espaciales […]
    Pablo Javier Piacente
  • Los archivos geológicos anticipan nuestro futuro climático 27 junio, 2024
    Hace 56 millones de años, la erosión del suelo se cuadruplicó en el planeta debido a las fuertes lluvias y las inundaciones de los ríos provocadas por un calentamiento global muy similar al que conocemos hoy.
    Eduardo Martínez de la Fe
  • Ya es posible transmitir el tacto a través de Internet 26 junio, 2024
    Un nuevo estándar para la compresión y transmisión del sentido del tacto mediante Internet sienta las bases para la telecirugía, la teleconducción y nuevas experiencias de juego en línea, entre otras aplicaciones. El flamante estándar HCTI (Haptic Codecs for the Tactile Internet) es para el “tacto digital” lo que son JPEG, MP3 y MPEG para […]
    Pablo Javier Piacente
  • Las primeras muestras de la cara oculta de la Luna ya están en la Tierra 26 junio, 2024
    La cápsula de reingreso de la sonda Chang'e-6 de China, que transporta hasta dos kilogramos de materiales extraídos y perforados de la cuenca más antigua de la Luna ubicada en su lado oscuro, aterrizó este martes 25 de junio en la región de Mongolia Interior y fue rápidamente recuperada, según informó la Administración Nacional del […]
    Pablo Javier Piacente
  • La Tierra tendrá dos soles dentro de 1,3 millones de años y durante 60.000 años 26 junio, 2024
    Dentro de 1,3 millones de años, la Tierra tendrá una especie de segundo sol porque la estrella Gliese 710 se acercará a 1,1 años luz de la Tierra y la veríamos del mismo tamaño que Júpiter. Lo malo es que esa alteración cósmica puede provocar un episodio en nuestro planeta como el que acabó con […]
    Eduardo Martínez de la Fe
  • China descubre grafeno natural en la Luna 25 junio, 2024
    Investigadores chinos han descubierto recientemente grafeno natural de escasas capas por primera vez en la Luna, a partir de las muestras traídas a la Tierra por la sonda Chang'e 5. El hallazgo proporciona nuevos conocimientos sobre las actividades geológicas, la historia evolutiva y las características ambientales de la Luna.
    Pablo Javier Piacente
  • Los incendios forestales extremos se duplicaron en los últimos 20 años en todo el planeta 25 junio, 2024
    Una nueva investigación concluye que la frecuencia e intensidad de los incendios forestales extremos se ha más que duplicado en todo el mundo en las últimas dos décadas, debido al calentamiento global antropogénico y otros factores relacionados. Se trata de la primera ocasión en la cual los científicos pudieron trazar una tendencia global para los […]
    Pablo Javier Piacente
  • Detectado en el Mediterráneo el neutrino más energético del universo 25 junio, 2024
    El neutrino más potente jamás observado ha dejado su huella en las profundidades del Mediterráneo, aunque todavía se desconoce de qué rincón del universo procede. Los neutrinos cosmogénicos son los mensajeros de algunos de los eventos más cataclísmicos del cosmos.
    Eduardo Martínez de la Fe
  • La IA identifica seis formas diferentes de depresión 24 junio, 2024
    Los científicos han identificado seis formas biológicamente distintas de depresión gracias a la aplicación de la Inteligencia Artificial (IA) en estudios cerebrales. El hallazgo podría explicar por qué algunas personas no responden a los tratamientos tradicionales para la afección, como los antidepresivos y la terapia psicológica.
    Pablo Javier Piacente