El tamaño y complejidad del genoma humano, cuya secuencia completa no se conoció íntegramente hasta 2003, ha obstaculizado muchas investigaciones que supondrían un importante avance en el campo de la medicina.
Ahora, científicos de la Universidad Carnegie Mellon en Pensilvania, Estados Unidos, confían en las avanzadas herramientas informáticas para poner en marcha una investigación que, si tiene éxito, permitiría utilizar de manera rutinaria información extraída a partir del ADN de un paciente para guiar a los médicos en el diagnóstico y tratamiento de enfermedades.
Según publica la propia universidad en un comunicado, el proyecto cuenta durante su primer año de vida con el patrocinio de Ion Torrent, unidad de la multinacional americana de biotecnología Life Technologies Corporation (NASDAQ: LIFE), aunque se esperan más fondos a través de ayudas federales y otras fuentes.
Biólogos, estadísticos, bioinformáticos e informáticos conforman un equipo multidisciplinar de investigadores, liderado por Robert F. Murphy, director del Centro Lane de Bioinformática en la Escuela de Ciencias de la Computación de Carnegie Mellon. Dada la complejidad de la investigación, los investigadores cuentan además con la colaboración de científicos del Colegio Baylor de Medicina de Texas y de la Universidad de Yale en Connecticut, ambos en Estados Unidos.
El objetivo final no es otro que desarrollar un software que la Fundación Ion Torrent y su director ejecutivo, Jonathan M. Rothenberg, han llamado Doctor in a Box, algo así como un doctor en una caja, de ordenador, se entiende. Esta herramienta tomaría una secuencia de ADN de un paciente y lo utilizaría para diagnosticar posibles enfermedades, identificar la susceptibilidad del paciente a las mismas y predecir qué terapias podrían ser más eficaces o causar menos efectos secundarios.
El Aprendizaje Automático como base
Para llevar a cabo la investigación, los científicos se valen de sistemas de Aprendizaje Automático, cuyo objetivo es desarrollar técnicas que permitan a los ordenadores detectar asociaciones entre infinidad de datos, algo fundamental si se quiere trabajar con elementos tan complejos como el genoma humano.
“Hay ya demasiada información para que los médicos den sentido a todo”, señaló el director del proyecto. De ahí que recurran al Aprendizaje Automático en el análisis de la secuencia de ADN, de la que esperan extraer toda aquella información codificada en los genes que pueda “ser relevante para médicos y pacientes”, agregó Murphy.
Aunque su equipo no ha sido el primero en utilizar herramientas de Aprendizaje Automático para analizar el genoma completo, la novedad de esta investigación radica en el desarrollo de un software exclusivo creado en el seno de la propia universidad. Este será instruido específicamente para analizar el tipo de secuencia de datos del genoma completo producidos por la tecnología de secuenciación única de Ion Torrent.
Su aplicación es idónea en el ámbito clínico, ya que está diseñada para secuenciar el genoma humano completo en un día por tan sólo 1.000 dólares. Hasta ahora, esta práctica había sido algo impensable en el ámbito clínico rutinario, pues conllevaba varias semanas completarla y con un coste diez veces superior. “Ahora que Ion Torrent puede reducir tiempo y gastos, el siguiente paso es crear una herramienta que permita a los médicos integrar fácilmente la secuenciación completa del genoma en la práctica médica”, manifestó Rothenberg.
Ese es el compromiso adquirido con Doctor in a box, con el que pretenden “mediante el uso de inteligencia artificial, como hemos visto con Watson, el sistema informático de inteligencia artificial de IBM, ser capaces de asociar las variaciones en el genoma humano con la cantidad fija de información que tenemos sobre la salud”, añadió el representante de Ion Torrent.
Fases de la investigación
Dada la complejidad del reto, el equipo de Carnegie Mellon requerirá la colaboración de otros grupos para estudiar el genoma, de ahí que procuren desarrollar un software disponible como código abierto. “Es una tarea enorme, pero estamos creando un marco que nos permitirá abordar este problema por piezas, y hacerlo a una escala que cobra sentido cuando todas esas piezas se juntan”, explicó Murphy.
Así, el primer paso a lo largo de este año será identificar las características del genoma asociadas con una sola enfermedad o población de pacientes, los cuales no han sido seleccionados aún. Mientras tanto, los investigadores del Colegio Baylor y la Universidad de Yale llevarán a cabo la secuenciación completa del genoma de pacientes, lo que proporcionará complejos registros médicos, tales como tratamientos de la enfermedad y sus resultados, y los resultados de los ensayos clínicos.
Dicha información pasará entonces a manos del equipo de Carnegie Mellon para su análisis y posterior aplicación de los programas de Aprendizaje Automático, con el objetivo de aclarar las relaciones entre los datos genómicos y los resultados clínicos de cada uno de los pacientes anónimos, al tiempo que incorporan información de la literatura biomédica referente a la expresión de genes y proteínas, y sobre el desarrollo de la enfermedad.
Con el resultado de estos análisis, los investigadores prevén crear modelos basados en secuencias genómicas con los que predecir la vulnerabilidad de un paciente ante las enfermedades, así como su respuesta al tratamiento o la elección de las terapias preventivas más adecuadas. Algo que, en esta fase inicial, todavía se plantea como un gran reto.
Hacer un comentario