Los científicos han entrenado a una IA y acaba de hacer lo impensable: ha creado proteínas nunca vistas
Un modelo entrenado con genomas de bacterias es capaz de idear nuevos genes y proteínas que funcionan, algo nunca visto hasta ahora
Si algo es fundamental a la hora de estudiar la biología de cualquier especie, esas son las proteínas, ya que son las que hacen el trabajo dentro de las células. Ahora, por increíble que parezca, la IA puede predecir su forma e incluso diseñarlas. Eso sí, la verdadera innovación empieza en los genes. Sabemos que el ADN es un lenguaje muy complejo y por eso sorprende que un equipo de científicos haya conseguido entrenar una IA capaz de entenderlo y, a partir de ahí, crear proteínas nuevas que no existían.
Jugando a la creación desde la computación del siglo XXI
Una de las ideas que hizo posible el estudio, publicado en la revista científica Nature, es entender cómo están organizados muchos genomas simples. En ellos, los genes que colaboran en una misma tarea suelen aparecer juntos, formando bloques fáciles de leer para la célula. Esa lógica permitió a los investigadores entrenar a Evo, una inteligencia artificial que funciona como un modelo de lenguaje, pero aplicado al ADN.
Los científicos ofrecían al modelo fragmentos de secuencias y Evo debía predecir qué base venía después. Con cada acierto se reforzaba su aprendizaje y, con el tiempo, empezó a interpretar un tramo de genoma igual que un modelo de texto interpreta una frase: entendiendo su contexto y continuándolo con sentido.
Las primeras pruebas consistieron en algo sencillo: darle a Evo parte de un gen conocido. Si recibía el 30 %, era capaz de completar hasta el 85 % restante. Y lo hacía cambiando solo aquellas partes de la secuencia donde la evolución suele permitir variaciones, como si hubiese aprendido hasta dónde se puede modificar un gen sin romperlo.
El experimento tampoco se detuvo ahí. Con otra toxina que se desactiva mediante pequeños ARN, fragmentos cortos de material genético, Evo produjo secuencias capaces de adoptar la forma correcta pese a no parecerse a nada conocido. Y al probar con inhibidores del sistema defensivo CRISPR, la herramienta que las bacterias usan contra los virus, volvió a sorprender: un 17 % de las proteínas generadas funcionó y dos eran tan extrañas que confundieron a los programas que predicen estructuras.
El equipo quiso poner a prueba los límites de Evo y le dio 1,7 millones de genes de bacterias y virus para que generase nuevas secuencias. El resultado fue una enorme colección de ADN sintético con secuencias conocidas, pero también con algunas totalmente nuevas. Es difícil que este método funcione en organismos más complejos, pero demuestra algo importante: podemos encontrar funciones biológicas nuevas si observamos directamente el ADN, que es donde la evolución crea sus innovaciones. Y es que la vida puede abrirse paso, incluso desde la informática más avanzada.