Tendencias21

DeepMind: La Inteligencia Artificial revoluciona las ciencias de la vida

Las ciencias de la vida están revolucionadas por disponer del más completo mapa de proteínas humanas gracias a la Inteligencia Artificial, un logro de DeepMind comparable a la secuenciación del genoma humano que ayudará en el tratamiento de enfermedades incurables y en la gestión del cambio climático.

El laboratorio de investigación DeepMind, en asociación con el Instituto Europeo de Bioinformática de EMBL (EMBL-EBI), ha creado el mapa más completo de proteínas humanas utilizando la Inteligencia Artificial (IA), toda una revolución en las ciencias de la vida.

Algunos científicos comparan el impacto potencial de este desarrollo con el del Proyecto Genoma Humano (1990-2003), que consiguió una secuencia completa al 90 por ciento de los tres mil millones de pares de bases del genoma humano.

Ahora la IA ha conseguido algo mucho más complicado: descifrar la estructura de más de 20.000 proteínas humanas, más del doble del número disponible hasta ahora, así como de casi todas las proteínas producidas por 20 organismos de referencia.

Se trata, según explican los protagonistas de esta proeza en un artículo publicado en Nature, del primer método computacional que puede predecir regularmente estructuras de proteínas con precisión atómica, incluso cuando no se conoce una estructura similar.

The Verge destaca al respecto que en la actualidad hay alrededor de 180.000 estructuras de proteínas disponibles que son dominio público, cada una producida mediante métodos experimentales y accesibles a través del Protein Data Bank.

DeepMind y EMBL-EBI añaden ahora predicciones para la estructura de unas 350.000 proteínas en 20 organismos diferentes, incluidos animales como ratones y moscas de la fruta, y bacterias como E. coli.

Aunque lo que aportan DeepMind y EMBL-EBI se superpone en parte con lo anteriormente disponible en Protein Data Bank, lo más significativo de su aportación es que incluye predicciones para el 98 por ciento de todas las proteínas humanas, alrededor de 20.000 estructuras diferentes, que se conocen con el nombre de proteoma humano. No es el primer conjunto de datos públicos de proteínas humanas, pero es el más completo y preciso, señala The Verge.

AlphaFold, la clave

Para alcanzar este espectacular resultado, DeepMind se apoyó en una herramienta propia de aprendizaje automático llamada AlphaFold, basada en redes neuronales.

Hace un año, AlphaFold ya había resuelto uno de los mayores desafíos de los últimos 50 años: cómo las proteínas se pliegan en formas 3D. Este programa de IA fue capaz de predecir estas estructuras a partir de sus secuencias de aminoácidos.

Para el nuevo desarrollo, AlphaFold fue instruido en secuencias de ADN y en las formas ya conocidas de decenas de miles de proteínas, contenidas en una base de datos de proteínas de acceso público alojada por los investigadores de EBI-EMBL.

Tal como explican los autores en su artículo, la última versión de AlphaFold se sustenta en un nuevo enfoque de aprendizaje automático que incorpora conocimientos físicos y biológicos sobre la estructura de las proteínas, aprovechando las alineaciones de múltiples secuencias.

Las proteínas son moléculas complejas que realizan numerosas tareas en el organismo, desde la elaboración de tejidos hasta la defensa contra las enfermedades. Su propósito está dictado por su estructura, que se pliega como una hoja de papiroflexia en formas complejas e irregulares.

Comprender cómo se pliega una proteína ayuda a explicar su función, lo que a su vez permite a los científicos realizar una variedad de tareas, desde realizar investigaciones fundamentales sobre cómo funciona el cuerpo, hasta diseñar nuevos medicamentos y tratamientos.

Tema relacionado: La inteligencia artificial simplifica el camino hacia las proteínas sintéticas

Ejemplos de estructuras de proteínas predichas por AlphaFold . Imagen: DeepMind

Transparencia

Todo el proceso de la nueva investigación se ha hecho a plena luz del día, en presencia de taquígrafos, porque con anterioridad DeepMind había publicado el código fuente de AlphaFold y detallado cómo se construyó.

El trabajo no termina aquí, porque la base de datos obtenida con la IA se actualizará con el objetivo de visualizar 130 millones de estructuras proteicas a finales de este año.

El resultado obtenido es una gran herramienta científica que complementa las tecnologías existentes y permitirá a los biólogos ampliar los límites de la comprensión de la vida, explica Ewan Birney, subdirector general del EMBL, en Cambridge Independent.

En un artículo complementario al de los científicos, Nature informa a su vez que los biólogos estructurales y otros investigadores ya están comenzando a utilizar AlphaFold para obtener modelos más precisos de proteínas que han sido difíciles o imposibles de caracterizar con los métodos experimentales actuales.

Desafío resuelto

Añade que predecir la forma tridimensional en la que se pliegan las proteínas ha sido uno de los «grandes desafíos» no resueltos de la biología, desde el descubrimiento en 1953 de la estructura del ADN.

Antes de la IA, la predicción de la estructura de una proteína a partir de la secuencia era un proceso que consumía mucho tiempo, por no decir mucho trabajo, con pocas garantías de obtener un resultado preciso, señala Nature.

Sin embargo, la IA ha demostrado que puede predecir con precisión las estructuras de las proteínas en minutos u horas, en comparación con los meses o años que solía tomar para determinar la estructura de solo una o dos proteínas.

Y eso abre posibilidades de aplicaciones, por ejemplo, en la ingeniería de enzimas para descomponer contaminantes ambientales como los microplásticos, entre otras posibles aplicaciones de esta nueva información, según Nature.

Hay que seguir

La revista también advierte que este desarrollo no es el final del camino: aunque la IA en ciencia y tecnología es buena para producir resultados precisos, todavía queda trabajo por hacer para desbloquear la ciencia (la biología, la química y la física esenciales) de cómo y por qué las proteínas se pliegan.

Precisa asimismo que es demasiado pronto para predecir exactamente qué impacto tendrá la aplicación de la IA en las ciencias de la vida, ya que para anticipar con precisión cómo la IA cambiará la biología se necesitan más datos experimentales que todavía no tenemos.

Lo más importante de lo conseguido hasta ahora es que la comunidad de investigación en biología estructural, y sus colaboradores en otros campos, disponen ya de un vasto tesoro de datos nuevos todavía por explorar, concluye Nature.

Beneficio para la humanidad

DeepMind señala a su vez que, a medida que los investigadores busquen curas para enfermedades y soluciones a otros grandes problemas que enfrenta la humanidad, incluida la resistencia a los antibióticos o el cambio climático, se beneficiarán de nuevos conocimientos sobre la estructura de las proteínas.

Para la empresa protagonista de este desarrollo, se trata la contribución más significativa que la IA ha hecho al avance del conocimiento científico, y es un gran ejemplo de los beneficios que la IA puede aportar a la humanidad.

Referencia

Highly accurate protein structure prediction with AlphaFold. John Jumper et al. Nature (2021). DOI:https://doi.org/10.1038/s41586-021-03819-2

Foto superior: Imagen de Gerd Altmann en Pixabay.

Eduardo Martínez de la Fe

Eduardo Martínez de la Fe

Eduardo Martínez de la Fe, periodista científico, es el Editor de Tendencias21.

1 comentario