Tendencias21
Una nueva herramienta pone los recursos bioinformáticos de Internet al alcance de todos

Una nueva herramienta pone los recursos bioinformáticos de Internet al alcance de todos

Una innovadora metodología que por primera vez permite el descubrimiento, extracción y clasificación automática de recursos bioinformáticos a partir de la literatura científica especializada en el área, ha sido desarrollada por investigadores de la Facultad de Informática de la Universidad Politécnica de Madrid. El índice de recursos está disponible libremente a través de la aplicación web situada en el servidor.

Una nueva herramienta pone los recursos bioinformáticos de Internet al alcance de todos

Después de la conclusión del Proyecto Genoma Humano, la proliferación de recursos bioinformáticos en los últimos años obliga a los investigadores a tener que dedicar buena parte de su tiempo a buscar estos recursos en la red. El Grupo de Informática Biomédica (GIB) de la Facultad de Informática de la Universidad Politécnica de Madrid (UPM) ha desarrollado una innovadora metodología que, por primera vez, permite el descubrimiento y clasificación automática de recursos bioinformáticos a partir de artículos científicos, informa la citada Facultad en un comunicado.

En la actualidad existen numerosos recursos bioinformáticos on-line disponibles para toda la comunidad científica. Este número sigue creciendo exponencialmente día tras día. En la investigación biomédica, cada vez es más frecuente que los recursos generados por los investigadores —bases de datos, software, recursos de varios tipos— se pongan a disposición de toda la comunidad científica para así acelerar el avance científico. Descubrir, localizar y aprender cómo usar nuevas aplicaciones supone un coste—sobre todo en términos de tiempo—que la gran mayoría de investigadores no pueden asumir. Por ello surge la necesidad de organizar los recursos existentes para facilitar lo más posible estas tareas de búsqueda.

Un equipo de investigadores del GIB de la Facultad de Informática de la UPM (Guillermo de la Calle, Miguel García-Remesal, Diana de la Iglesia y Stefano Chiesa), dirigidos por el catedrático Víctor Maojo, ha desarrollado una innovadora metodología que por primera vez permite el descubrimiento, extracción y clasificación automática de recursos bioinformáticos a partir de la literatura científica especializada en el área. El índice de recursos desarrollado está disponible libremente a través de la aplicación web situada en el servidor.

Procesamiento de Lenguaje Natural

La metodología está basada en técnicas de Procesamiento del Lenguaje Natural e Inteligencia Artificial que permiten la extracción y clasificación automática de información relevante contenida en artículos científicos, principalmente en los abstracts. Cada artículo es analizado morfológica, sintáctica y semánticamente buscando una serie de patrones establecidos, que permiten identificar de manera automática y sin intervención del usuario los nombres, funcionalidad, URL de acceso y, en algunos casos, las entradas y salidas de dichos recursos.

Adicionalmente, los recursos son clasificados atendiendo a dos dimensiones, por un lado el dominio de aplicación (por ejemplo, ADN, ARN o Proteína) y por otro la categoría (funcionalidad/tipo) de recurso (por ejemplo, alineamiento, base de datos o anotación). Para realizar dicha clasificación, se utiliza una taxonomía de dominios y categorías específicamente diseñada con este fin y basada en otras taxonomías ya existentes, por ejemplo BLD – Bioinformatics Links Directory.

Para validar la metodología, el grupo de la UPM realizó un experimento preliminar con 400 artículos indexados en el ISI Web of Knowledge. Se realizó una búsqueda con la cadena «bioinformatics resources», seleccionando los 392 primeros artículos más relevantes de acuerdo con su factor de impacto. El resto eran artículos no relacionados con recursos bioinformáticos, que fueron introducidos como conjunto de control para verificar la robustez del método. De este conjunto se extrajeron automáticamente 376 nombres de recursos, lo que supone un índice de acierto de casi el 95%.

Como trabajo adicional, se ha puesto a libre disposición de la comunidad científica una aplicación web basada en Servicios Web, que permite acceder al índice creado y buscar recursos por el nombre, categoría y dominio.

La principal ventaja del nuevo método frente a los índices de recursos existentes reside en su creación y actualización, tareas que se realizan de forma automática. Dado su carácter genérico, esta metodología se está aplicando en el marco del proyecto europeo ACTION-Grid, la primera iniciativa europea en Grid Computing, Informática Biomédica y Nanoinformática, coordinado por el profesor Víctor Maojo.

Tanto la metodología como los resultados han sido publicados en los congresos y revistas más prestigiosas del sector, como el publicado en BMC Bioinformatics: Guillermo de la Calle, Miguel García-Remesal, Stefano Chiesa, Diana de la Iglesia and Victor Maojo. BIRI: a new approach for automatically discovering and indexing available public bioinformatics resources from the literature. BMC Bioinformatics 2009, 10:320.

Hacer un comentario

RSS Lo último de Tendencias21

  • Descubren que la base del lenguaje humano se desarrolló hace 135.000 años 20 marzo, 2025
    Los humanos hablamos más de 7.000 idiomas en la actualidad, muy diferentes entre ellos: sin embargo, un nuevo estudio ha descubierto que todas estas variantes idiomáticas provienen de un solo árbol genealógico lingüístico, que surgió antes de que nuestra especie se dividiera en poblaciones distintas hace 135.000 años. Solo 35.000 años después, el lenguaje habría […]
    Pablo Javier Piacente / T21
  • Nace el primer periódico creado íntegramente por la Inteligencia Artificial 20 marzo, 2025
    Por primera vez en la historia, un periódico italiano ha publicado una edición especial en la que cada palabra, titular y cita han sido generados exclusivamente por IA. Así nace Il Foglio AI, un proyecto que promete revolucionar la forma en que concebimos las noticias.
    Redacción T21
  • Google habría impulsado una IA experimental involucrada en la muerte de un adolescente 20 marzo, 2025
    Plataformas respaldadas por gigantes tecnológicos como Google han introducido chatbots de IA interactivos dirigidos a niños y adolescentes, abriendo fuertes debates sobre su impacto en el desarrollo infantil. En concreto, la aplicación experimental Character.AI ha sido objeto de demandas legales por parte de distintas familias, que alegan que sus hijos fueron expuestos a contenidos perjudiciales […]
    Pablo Javier Piacente / T21
  • Sudáfrica y China logran una conexión cuántica satelital récord de casi 13.000 kilómetros 20 marzo, 2025
    Un equipo internacional de científicos ha establecido una conexión satelital cuántica histórica entre Sudáfrica y China, cubriendo una distancia récord de 12.900 kilómetros. Gracias al fenómeno del entrelazamiento cuántico, esta tecnología garantiza comunicaciones absolutamente seguras frente a cualquier intento de espionaje.
    Redacción T21
  • Los tribunales no reconocen derechos de autor a la Inteligencia Artificial 20 marzo, 2025
    Un tribunal de apelaciones en Estados Unidos ha puesto límites a la creatividad de las máquinas: las obras generadas exclusivamente por inteligencia artificial no pueden ser protegidas por derechos de autor. El fallo reafirma que la ley actual requiere la participación humana para garantizar la protección legal de una obra.
    Redacción T21
  • Desvelan la primera luz que encendió el Universo 20 marzo, 2025
    El Telescopio de Cosmología de Atacama (ACT) ha compilado el mapa más detallado que hemos visto hasta hoy del fondo cósmico de microondas, la tenue luz que impregna el Universo desde solo 380.000 años después del Big Bang y cuyos ecos pueden apreciarse en la actualidad. La imagen obtenida es lo más parecido a la […]
    Redacción T21
  • Microsoft e Inait revolucionan la Inteligencia Artificial con cerebros digitales casi humanos 20 marzo, 2025
    Microsoft ha unido fuerzas con la startup suiza Inait para desarrollar sistemas de IA inspirados en el cerebro humano. Esta colaboración busca crear modelos que no solo aprenden de datos, sino que también razonan como el cerebro humano.
    Redacción T21
  • Una prueba de consciencia corporal desafía las visiones tradicionales sobre la cognición animal 19 marzo, 2025
    Los gorilas pueden ser tan conscientes de sí mismos como los chimpancés, según ha comprobado una nueva investigación: luego de realizar una prueba de autoconsciencia corporal bajo parámetros diferentes a las tradicionales, los científicos verificaron que las capacidades cognitivas de estos simios se habían menospreciado hasta hoy.
    Pablo Javier Piacente / T21
  • China plantea la necesidad de etiquetar el contenido generado con IA 19 marzo, 2025
    En colaboración con varios ministerios gubernamentales, la Administración China de Control del Ciberespacio (CAC) ha anunciado que todo el contenido generado por IA en Internet tendrá que ser etiquetado como tal. Sería la forma a través de la cual el gigante asiático se acopla a la idea europea de establecer algún tipo de regulación sobre […]
    Pablo Javier Piacente / T21
  • Escándalo: Elon Musk implanta en la Casa Blanca su servicio de internet satelital Starlink 19 marzo, 2025
    Starlink ha instalado en la Casa Blanca un servicio de Internet satelital paralelo al sistema oficial de telecomunicaciones que suscita dudas sobre su legalidad, abre brechas de seguridad en las comunicaciones secretas y aventaja a las empresas de Elon Musk en el acceso a proyectos oficiales. Polémica.
    EDUARDO MARTÍNEZ DE LA FE/T21