Un motor de búsqueda relaciona los artículos de biomedicina con secuencias de ácidos nucleicos

Investigadores del Grupo de Informática Biomédica de la Facultad de Informática de la Universidad Politécnica de Madrid han creado una herramienta denominada PubDNA Finder que es el primer buscador especializado en artículos de biomedicina y su relación con los ácidos nucleicos.

PubDNA Finder es un repositorio on line creado para vincular los documentos archivados en PubMed Central con las secuencias de ácidos nucleicos que aparecen en ellos. PubMed Central es el archivo digital gratuito del Instituto Nacional de Salud de Estados Unidos. Desarrollado y administrado por el Centro de Información Biotecnológica (NCBI), contiene la principal documentación relativa a la biomedicina y las ciencias de la vida publicada en diferentes revistas científicas de todo el mundo.

PubDNA Finder amplía las capacidades de búsqueda proporcionada por PubMed Central, permitiendo a los investigadores biomédicos realizar búsquedas avanzadas con secuencias de ácidos nucleicos. Esto incluye, entre otras características, la búsqueda de los documentos que citan una o varias secuencias específicas de ácidos nucleicos y la recuperación de las secuencias genéticas que aparecen en diferentes artículos.

Índice de búsqueda

Estas capacidades de consulta adicionales son proporcionadas por un índice de búsqueda creado mediante el archivo completo de los 176.672 documentos disponibles en PubMed Central y las secuencias de ácidos nucleicos que aparecen en ellos.

Para extraer automáticamente las secuencias genéticas que ocurren en cada búsqueda, se ha utilizado un método original:las secuencias se extraen sin intervención directa del usuario mediante un sistema innovador que combina el procesamiento de lenguaje natural, la minería de textos y técnicas de ingeniería del conocimiento.

La base de datos se actualiza mensualmente de forma automática mediante conexión FTP con el sitio de PubMed Central para recuperar los manuscritos y los nuevos índices. Los usuarios pueden consultar la base de datos a través de la web.

El equipo de investigación que ha desarrollado esta herramienta está dirigido por el profesor de la Facultad Miguel García-Remesal, perteneciente al Grupo de Informática Biomédica que dirige el profesor Víctor Maojo.

Los resultados de esta investigación han sido publicados en la revista Bioinformatics.

García-Remesal M, Cuevas A, Pérez-Rey D, Martín L, Anguita A, de la Iglesia D, de la Calle G, Crespo J, Maojo V. PubDNAFinder: a web databaselinking full-textarticlestosequences of nucleicacids. Bioinformatics 2010, Nov 1;26(21):2801-2.