Atención: lo que les reporto aquí NO ES ciencia ficción, es una realidad que ya existe y funciona muy bien. Disfrútenlo y sean optimistas con la genética molecular!
La variación es una característica fundamental de la biología, el impulsor de la diversidad y el motor de la evolución, pero tiene un lado oscuro. Las alteraciones en las secuencias de ADN y las proteínas resultantes que construyen nuestras células a veces pueden conducir a profundas alteraciones en la función fisiológica y causar enfermedades.
Pero ¿qué alteraciones genéticas son normales o al menos intrascendentes y cuáles presagian una enfermedad?
La respuesta es clara para un puñado de mutaciones genéticas bien conocidas, sin embargo, a pesar de los avances dramáticos en la tecnología de secuenciación del genoma durante los últimos 20 años, nuestra capacidad para interpretar el significado de millones de variaciones genéticas identificadas a través de dicha secuenciación aún es muy limitada.
Para resolver este problema, Marks y colaboradores de la Facultad de Medicina de Harvard y la Universidad de Oxford han diseñado una herramienta de inteligencia artificial(IA) llamada EVE (modelo evolutivo de efecto variante), que utiliza un tipo sofisticado de aprendizaje automático para detectar patrones de variación genética en cientos de miles de seres de especies no humanas y luego utilizarlos para hacer predicciones sobre el significado de las variaciones en los genes humanos.
=> Recibir por Whatsapp las noticias destacadas
En un análisis publicado el 27 de octubre en Nature, los investigadores utilizaron EVE para evaluar 36 millones de secuencias de proteínas y 3219 genes asociados a enfermedades en múltiples especies.
Los resultados indican que 256.000 variantes de genes humanos previamente identificadas y cuya importancia clínica era desconocida, deben ser reclasificadas como benignas o causantes de enfermedades con los nuevos datos obtenidos por EVE.
EVE se puede emplear para aumentar los métodos clínicos actuales que se utilizan para determinar el significado de las variantes genéticas. Si se usa en combinación con los métodos clínicos actuales, EVE podría aumentar la precisión y exactitud del diagnóstico, el pronóstico y la elección del tratamiento.
Cada vez con mayor frecuencia, las personas tienen acceso a la secuenciación de sus genomas, pero no es fácil dar sentido a los datos. Hay muy poca información sobre lo que significa para la probabilidad de enfermedad o progresión de la enfermedad. Debora Marks, profesora asociada de biología de sistemas en el Instituto Blavatnik , Yarin Gal en Oxford University; Jonathan Frazer y Mafalda Dias en la Escuela de Medicina de Harvard, y Pascal Notin en Oxford University, enfatizan que EVE no es una prueba de diagnóstico, pero su destreza computacional puede aumentar las herramientas clínicas actuales utilizadas por los genetistas y otros médicos para hacer diagnósticos, predecir la progresión de la enfermedad e incluso elegir el tratamiento basado en la presencia de ciertas mutaciones genéticas que causan enfermedades.
Este novedoso modelo EVE se puede utilizar como una herramienta adicional en las evaluaciones clínicas actuales y ofrece una nueva y poderosa forma de reducir la incertidumbre y aclarar la toma de decisiones, particularmente en el entorno clínico .
De hecho, el análisis mostró que EVE superó a otros modelos de predicción computacional en la predicción del efecto clínico y también obtuvo una puntuación tan alta o mejor que los programas considerados del más alto estándar en la actualidad que prueban el efecto de una mutación genética en la función biológica.
Los riesgos de interpretar con precisión el significado de la variación genética son enormes. La lectura de una variación benigna como causante de una enfermedad podría conducir a un diagnóstico erróneo, alimentando una cascada de pruebas adicionales, ansiedad e incluso intervenciones médicas innecesarias. Por el contrario, malinterpretar un cambio en el ADN de uno como intrascendente o benigno siendo que es causal de una enfermedad, podría brindar una falsa seguridad cuando se necesite observación atenta, más pruebas y medidas preventivas.
Lo que se espera que haga este enfoque usando EVE es generar datos poderosos que puedan empoderar a los médicos/genetistas para tomar las decisiones correctas de diagnóstico, pronóstico y tratamiento.
Más datos genéticos, más preguntas
La secuenciación histórica del genoma humano en 2003 estableció un genoma humano de referencia con el que se comparan los genomas recién secuenciados. Sin embargo, este genoma de referencia no es un estándar o una línea de base para un genoma humano «normal». La creciente cantidad de datos de la secuenciación de ADN hace que el genoma de referencia sea menos estándar y más fluido que la línea de base que cambia con el tiempo a medida que los investigadores comprenden mejor el significado de la variación genética.
La relación de cambios específicos en el genoma humano con la aparición de enfermedades continúa convulsionando el campo de la genética clínica. Aunque solo se ha secuenciado una pequeña fracción de la población humana, ya se están encontrando millones de variantes cuyo significado no están claros. De esas variantes, solo el 2 por ciento se clasifica como benigno, neutral o patógeno. El 98 por ciento restante de las variantes genéticas identificadas se clasifica actualmente de «un significado a definir».
En el genoma humano, las regiones de ADN que codifican proteínas, por sí solas, representan más de 6,5 millones de mutaciones observadas que afecta la posición de un solo aminoácido en una proteína producida por un gen. Estas denominadas mutaciones sin sentido, pueden no tener ningún efecto sobre la función de una proteína, o pueden hacer que la proteína sea disfuncional, causando una enfermedad. De hecho, se estima que puede haber una variante para cada posición de la proteína, salvo las letales, en los genomas de los 9 mil millones de personas que habitan el planeta. Cada individuo tiene muchas variantes en su genoma, en comparación con otras personas y con el genoma humano de referencia.
Añadiendo otro giro a una trama ya complicada, los humanos heredamos dos versiones de cada gen, una del padre y otra de la madre. Además, a medida que las personas envejecen, los genes pueden adquirir cambios, conocidos como mutaciones somáticas. Así pues, está claro que hay muchas formas en las que una persona tiene o adquiere cambios en sus genes . Es posible que tenga una variante diferente en una copia de un gen y, a medida que envejecemos, ocurren todo tipo de variaciones somáticas en ese gen, no solo relacionadas con por ejemplo el desarrollo del cáncer sino también con la neurodegeneración, los cuales son procesos relacionados con el envejecimiento impulsados por mutaciones .
Sin duda, hay varios genes asociados a enfermedades para los que los investigadores han identificado mutaciones que tienen un alto riesgo de enfermedad clínica, como el BRCA1 y BRCA2 para los cánceres de mama y ovario y el gen supresor de tumores p53 para una variedad de cánceres. Pero incluso esos mismos genes han mostrado otras mutaciones no estudiadas, cuyo significado sigue sin estar definido.
Todo esto crea una necesidad urgente de aclarar la importancia de las variaciones genéticas en los seres humanos, un proceso en el que la computación va a desempeñar un papel cada vez más importante para proporcionar respuestas.
Entra La Inteligencia Artificial ( IA)
Una característica definitoria de las redes neuronales es su capacidad para reevaluar y actualizar continuamente la probabilidad de una hipótesis a medida que se dispone de nuevos datos. Esto significa que las redes neuronales pueden reevaluar la evidencia utilizando nuevos conocimientos y, por lo tanto, pueden detectar patrones y significados no identificados por los métodos tradicionales.
En el estudio actual, los investigadores utilizaron EVE, un tipo sofisticado de análisis conocido como aprendizaje automático no supervisado, una forma de inteligencia artificial que no se basa en parámetros y reglas predefinidos, sino que implica aprendizaje adaptativo. Lo que esto significa es que cuando se le presentan nuevos datos, un algoritmo de aprendizaje automático mejorará en el reconocimiento de patrones a lo largo del tiempo. Por el contrario, en el aprendizaje automático supervisado, el algoritmo aprende a detectar patrones a partir de datos preetiquetados; su entrenamiento ha sido supervisado.
En un ejemplo clásico dado por los informáticos, el algoritmo se presenta con imágenes de perros y gatos y se le dice cuáles son cuáles antes de que se le desafíe a reconocer imágenes de perros y gatos sin etiquetas. En el aprendizaje automático no supervisado, el algoritmo recibe un conjunto de imágenes de perros y gatos y no se le dice cuáles son cuáles. Debe discernir los patrones por sí solo.
Ambos tipos ofrecen ventajas para tareas específicas. Una ventaja de los modelos no supervisados es que no hay posibilidad de sesgar su aprendizaje alimentándolos con datos preetiquetados. Además, pueden adaptarse a medida que cambian los datos para realizar análisis más complejos. La mayoría de los métodos computacionales actuales utilizados para evaluar la importancia de las variantes genéticas emplean entrenamiento supervisado basado en etiquetas clínicas, que pueden sesgar estas herramientas y causar una precisión inflada de predicción en el mundo real.
Debido a que el algoritmo no necesita saber de antemano qué imágenes son gatos, qué imágenes son perros, solo necesita un montón de imágenes de gatos y perros, no hay forma de usar información que no debería saber .
Es precisamente la capacidad del aprendizaje automático no supervisado para detectar nuevos patrones a partir de datos nunca antes encontrados lo que hace que este enfoque sea especialmente adecuado para analizar secuencias genéticas de seres no humanos.
Pistas de nuestros parientes evolutivos
En su reciente reporte Marks y colaboradores recurrieron a una vieja esperanza: que al estudiar la variación genética en múltiples especies, podrían obtener pistas sobre la importancia de la variación genética en los seres humanos.
La evolución tiende a preservar características que son críticas, o al menos importantes, para el funcionamiento y la supervivencia de las especies. Por lo tanto, los arreglos de aminoácidos ( una cadena formada de varios aminoácidos hace a una proteína y la posición y tipo de cada aminoácido en la cadena son importantes para la función de esa proteína) que se repiten entre especies son marcadores de importancia biológica, lo que indica que son importantes para la función de un organismo y su aptitud evolutiva. Así pues, es probable que las alteraciones de secuencias tan altamente conservadas provoquen problemas y estén relacionadas con la patogenicidad.
Estas especies están muy lejos evolutivamente hablando, y hay muchas diferencias genéticas, pero en conjunto, nos dan información. Los científicos han utilizado la genética comparativa durante muchos años para detectar regiones de similitud en secuencias de ADN o proteínas para conocer su significado. El equipo de Harvard-Oxford utilizó una red neuronal para hacerlo a una escala mucho mayor. EVE buscó patrones conservados evolutivamente para sacar conclusiones. Analizó datos de 140.000 especies, incluidos organismos en peligro de extinción y extintos. Es por eso que EVE es tan poderoso sobre patrones que son relevantes para los humanos y la variación humana.
Entrenamiento de EVE
Después de entrenar en 250 millones de secuencias de proteínas, EVE estimó la probabilidad de que cada variante de aminoácidos sea benigna o patógena. Para determinar si EVE estaba haciendo predicciones precisas, los investigadores compararon sus puntuaciones con mutaciones humanas establecidas cuya importancia se conoce. Los resultados obtenidos fueron notablemente consistentes con los datos clínicos.
A continuación, los investigadores aplicaron EVE a un conjunto de 3219 genes humanos asociados con enfermedades. EVE tomó la decisión correcta sobre si la mutación era patógena o benigna en todos los genes. Cuando los investigadores compararon el desempeño de EVE con el de otros programas supervisados y no supervisados, EVE mostró una precisión de predicción notablemente mayor.
¿cómo se comparan las predicciones de EVE con los hallazgos de experimentos clínicos reales, el estándar de oro para evaluar cómo una mutación genética afecta la función fisiológica?
Para responder a esta pregunta, el equipo comparó las puntuaciones de EVE con los resultados de experimentos clínicos que incluían mutaciones bien estudiadas en cinco genes, entre ellos genes relacionados con diversas formas de cáncer, y trastornos del ritmo cardíaco. Las predicciones de EVE se superpusieron con las etiquetas actuales de los datos experimentales. Los resultados resultaron ser mucho mejores de lo que se esperaba.
Al parecer, simplemente entrenando a EVE para que se ajuste a la distribución de secuencias a lo largo de la evolución, se extrae información que permite hacer predicciones inesperadamente precisas sobre el riesgo de enfermedad que surge de una variante genética determinada.
Cuestión de confianza
Una ventaja notable que tiene EVE sobre los métodos actuales es que asigna una puntuación continua en lugar de una puntuación binaria. Esto se debe a que incluso cuando las variantes genéticas se etiquetan como benignas o patógenas, la forma en que una mutación podría manifestarse fisiológicamente tiene más matices. La puntuación continua es muy importante para predecir cuál es el nivel de patogenicidad. ¿Significa la mutación que voy a tener dolor en el dedo meñique o voy a morir mañana?
Otro aspecto importante de la herramienta es que asigna una puntuación de confianza en la predicción gen por gen. Esto puede ayudar a los médicos/genetistas a contextualizar el grado de certeza de cualquier predicción. En otras palabras, para cada variante genética, EVE le dice al experto cuánto puede confiar en su predicción.
EVE no les proporciona a los médicos simplemente un número, sino que también les dá el grado de incertidumbre que conlleva. Esto es algo que el médico/genetista puede tomar en cuenta y utilizar en el proceso de toma de decisiones. EVE puede decir: ‘Creo que esa variante pertenece a esa pila, pero nunca había visto variantes como esa antes en pilas, así que tómatelo con precaución’. Alternativamente, EVE también puede decir, ‘Creo que esa otra variante pertenece a esta pila, y he visto variantes muy similares a eso en el pasado, y las vi pertenecer a esta pila y, por lo tanto, la voy a asignar a esta pila con mucha confianza. Generar confianza entre EVE y el médico/genetista es un aspecto crítico de este sistema/enfoque .
Mirando hacia el futuro
Este tipo de modelado aún está en su infancia, y está claro que la evolución y la variación genética todavía tienen mucho que enseñarnos sobre la enfermedad. Hay planes de extender el trabajo de EVE a otras partes del genoma más allá de las regiones codificadoras de proteínas.
En el futuro inmediato, sin embargo, la tarea urgente es hacer un uso clínico de la variación genética para la que tenemos algún conocimiento. Este grupo de investigadores y otros participan en Atlas of Variant Effects Alliance, un esfuerzo de investigación global cuya misión es mapear los efectos de la variación en el genoma y crear un atlas completo de todas las posibles variantes de genes humanos y sus efectos en la función y fisiología de las proteínas. El objetivo final es mejorar el diagnóstico, el pronóstico y el tratamiento de las enfermedades humanas.
Ronald Palacios Castrillo, M.D.,Ph.D.