‘ChatGPT para CRISPR’ crea nuevas herramientas de edición de genes


Algunos de los editores de genes diseñados por IA podrían ser más versátiles que los que se encuentran en la naturaleza.

En la búsqueda interminable para descubrir sistemas de edición de genes CRISPR previamente desconocidos, los investigadores han rastreado microbios en todo, desde aguas termales y turberas hasta excrementos e incluso yogur. Ahora, gracias a los avances en inteligencia artificial generativa (IA), podrían diseñar estos sistemas con solo presionar un botón.

Esta semana, los investigadores publicaron detalles de cómo utilizaron una herramienta de inteligencia artificial generativa llamada modelo de lenguaje de proteínas (una red neuronal entrenada en millones de secuencias de proteínas) para diseñar proteínas de edición de genes CRISPR y luego pudieron demostrar que algunos de estos sistemas funcionan como se esperaba en el laboratorio.



Y en febrero, otro equipo anunció que había desarrollado un modelo entrenado en genomas microbianos y lo utilizó para diseñar nuevos sistemas CRISPR, que se componen de una enzima cortadora de DNA o RNA y moléculas de RNA que dirigen las tijeras moleculares hacia dónde cortar.

“En realidad, esto es solo una muestra de lo que ocurre. Está demostrando que es posible diseñar estos sistemas complejos con modelos de aprendizaje automático”, afirma Ali Madani, científico del aprendizaje automático y director ejecutivo de la empresa de biotecnología Profluent, con sede en Berkeley, California. El equipo de Madani informó lo que dice es “la primera edición exitosa del genoma humano mediante proteínas diseñadas enteramente con aprendizaje automático” en una preimpresión del 22 de abril en bioRxiv.org .

=> Recibir por Whatsapp las noticias destacadas

Alan Wong, biólogo sintético de la Universidad de Hong Kong, cuyo equipo ha utilizado el aprendizaje automático para optimizar CRISPR, dice que los sistemas de edición de genes naturales tienen limitaciones en términos de las secuencias a las que pueden dirigirse y el tipo de cambios que pueden realizar. Por lo tanto, para algunas aplicaciones puede ser un desafío encontrar el CRISPR adecuado. “Ampliar el repertorio de editores mediante el uso de IA podría ayudar”.

Entrenado en genomas

Mientras que los chatbots como ChatGPT están diseñados para manejar el lenguaje después de haber sido entrenados en texto existente, las IA que diseñaron CRISPR fueron entrenadas en grandes cantidades de datos biológicos en forma de secuencias de proteínas o genoma. El objetivo de este paso de «preentrenamiento» es dotar a los modelos de información sobre secuencias genéticas naturales, como qué aminoácidos tienden a ir juntos. Esta información luego se puede aplicar a tareas como la creación de secuencias totalmente nuevas.

El equipo de Madani utilizó previamente un modelo de lenguaje proteico que desarrollaron, llamado ProGen, para generar nuevas proteínas antibacterianas. Para diseñar nuevos CRISPR, su equipo volvió a entrenar una versión actualizada de ProGen con ejemplos de millones de sistemas CRISPR diversos, que las bacterias y otros microbios unicelulares llamados arqueas utilizan para defenderse de los virus.

Dado que los sistemas de edición de genes CRISPR comprenden no sólo proteínas, sino también moléculas de RNA que especifican su objetivo, el equipo de Madani desarrolló otro modelo de IA para diseñar estos «RNA guía».

Luego, el equipo utilizó la red neuronal para diseñar millones de nuevas secuencias de proteínas CRISPR que pertenecen a docenas de familias diferentes de este tipo de proteínas que se encuentran en la naturaleza. Para ver si los CRISPR diseñados por IA eran auténticos editores de genes, el equipo de Madani sintetizó secuencias de DNA correspondientes a más de 200 diseños de proteínas pertenecientes al sistema CRISPR-Cas9 que ahora se utiliza ampliamente en el laboratorio. Cuando insertaron estas secuencias (instrucciones para una proteína Cas9 y un «RNA guía») en células humanas, muchos de los editores de genes pudieron cortar con precisión los objetivos previstos en el genoma.

La proteína Cas9 más prometedora (una molécula a la que llamaron OpenCRISPR-1) fue tan eficiente para cortar secuencias de DNA específicas como una enzima bacteriana CRISPR-Cas9 ampliamente utilizada, y realizó muchos menos cortes en el lugar equivocado. Los investigadores también utilizaron el diseño OpenCRISPR-1 para crear un editor base (una herramienta de edición genética de precisión que cambia las «letras» individuales del DNA) y descubrieron que también era tan eficiente como otros sistemas de edición base, así como menos propenso a errores.

Otro equipo, dirigido por Brian Hie, biólogo computacional de la Universidad de Stanford en California, y por el bioingeniero Patrick Hsu del Instituto Arc en Palo Alto, California, utilizó un modelo de IA capaz de generar secuencias tanto de proteínas como de RNA. Su modelo, llamado EVO(nada que ver con el narcopedófilo serial), se entrenó en 80.000 genomas de bacterias y arqueas, así como en otras secuencias microbianas, lo que equivale a 300 mil millones de letras de DNA. El equipo de Hie y Hsu aún no ha probado sus diseños en el laboratorio. Pero las estructuras predichas de algunos de los sistemas CRISPR-Cas9 que diseñaron se parecen a las de las proteínas naturales. Su trabajo se describió en una preimpresión publicada en bioRxiv.org.

Medicina de precisión

Esto es asombroso. Es impresionante por el hecho de que los investigadores puedan utilizar la molécula OpenCRISPR-1 sin restricciones, a diferencia de algunas herramientas patentadas de edición de genes. El modelo ProGen2 y el «atlas» de secuencias CRISPR utilizados para ajustarlo también están disponibles gratuitamente.

La esperanza es que las herramientas de edición de genes diseñadas por IA puedan adaptarse mejor a las aplicaciones médicas que las CRISPR existentes. Profluent espera asociarse con empresas que están desarrollando terapias de edición genética para probar los CRISPR generados por IA. Realmente se necesita precisión y un diseño a medida. Y creo que eso no se puede hacer simplemente copiando y pegando sistemas CRISPR naturales.

Un modelo 3D del complejo de edición de genes CRISPR-Cas9 de Streptococcus pyogenes.