Genoma Humano. ¿Cuántos genes contiene? ¿Existe una sola raza humana? ¿Es necesario invocar una superinteligencia para la creación del código complejo del ADN? Cómo se generó el complejo código genético?


 

Ronald Palacios Castrillo, M.D.,PhD.



 

De acuerdo con la anotación más reciente disponible (GENCODE Release 49, septiembre de 2025, sobre el ensamblaje de referencia GRCh38.p14), los recuentos autorizados actuales para el genoma humano son los siguientes:

=> Recibir por Whatsapp las noticias destacadas

  • Genes anotados totales: 78.5691 (solo cromosomas principales; se trata del conjunto exhaustivo de GENCODE).
  • Genes codificantes de proteínas: 19 433 (excluidos 664 genes de lectura continua [readthrough], que son transcritos de fusión a veces anotados por separado). Ensembl (Release 115, que utiliza el mismo GENCODE 49) informa una cifra muy similar de 19 869 genes codificantes en el ensamblaje primario (también excluyendo los de lectura continua).
  • Genes no codificantes de proteínas : ~59 258 (total de genes menos los codificantes de proteínas). Esta categoría incluye:
    • Genes de ARN no codificante largo (lncRNA): 35 899
    • Genes de ARN no codificante pequeño (miRNA, snoRNA, snRNA, etc.): 7 563
    • Pseudogenes: 14 701 (procesados: 10 638; no procesados: 3 536; unitarios: 290)

 

  • Segmentos génicos de inmunoglobulina/receptor de células T (IG/TR): ~649 en total (412 segmentos codificantes de proteínas + 237 pseudogenes; estos se destacan a menudo por separado en contextos inmunológicos)
    • Biotipos adicionales menores (ribozimas, ARN ribosomal, etc.).

Notas sobre estos números:

  • GENCODE constituye el conjunto de referencia de genes de estándar oro (fusión de la anotación manual Havana y la automática de Ensembl). Es el utilizado por Ensembl, el UCSC Genome Browser y la mayoría de los proyectos a gran escala. Estas cifras corresponden al ensamblaje primario; los haplotipos alternativos añaden un número pequeño de genes adicionales.
  • Los recuentos de genes codificantes de proteínas se han estabilizado en torno a 000–20.000 tras años de refinamiento; las sobreestimaciones anteriores (~25 000+) han sido corregidas. En el campo persiste un debate sobre si varios miles de los genes anotados como «codificantes» podrían ser en realidad no codificantes o expresados a bajos niveles, pero el número oficial anotado se mantiene en ~19.400– 19.900.

 

  • Los genes no codificantes han aumentado sustancialmente gracias a los datos de secuenciación de ARN de lectura larga y a la información funcional, especialmente los lncRNA. Los pseudogenes se incluyen aquí como «genes no codificantes» (son elementos anotados con aspecto génico pero que no producen proteínas funcionales). Si se prefiere separar los ARNnc funcionales de los pseudogenes, el total de genes de ARN no  codificante  funcional  asciende  a  ~43.000– 44.000 (lncRNA + ARNnc pequeños + otros).
  • Los loci IG/TR (críticos en inmunología) están completamente anotados en GENCODE, aunque a veces se reportan por separado debido a su recombinación somática.

Estos números están actualizados a mayo de 2026 (GENCODE 49 sigue siendo la versión más reciente). La anotación se refina de manera continua, por lo que pueden producirse pequeños cambios (± unos cientos de genes) en futuras versiones, pero el panorama general ha permanecido estable durante los últimos años.

Los ARN no codificantes (ARNnc) son transcritos procedentes de los ~59.000 genes no codificantes del genoma humano (según GENCODE Release 49, septiembre  de  2025:  35.899  genes  lncRNA  +  7.563 genes de ARNnc pequeños, más ~14.701 pseudogenes que pueden generar transcritos reguladores).

No codifican proteínas (con raras excepciones de micropéptidos procedentes de algunos lncRNA), pero desempeñan funciones estructurales, catalíticas y reguladoras esenciales en prácticamente todos los procesos celulares. Los ARNnc se dividen ampliamente en constitutivos (expresados de forma constante y esenciales para la maquinaria celular básica) y reguladores (a menudo específicos de tipo celular o tejido, expresados de manera dinámica e implicados en el ajuste fino de la expresión génica). También se clasifican por tamaño: ARNnc pequeños (<200 nt) y ARNnc largos (>200 nt, incluidas las formas circulares).

A continuación se presenta un panorama estructurado de las principales clases, sus funciones y mecanismos primarios, junto con ejemplos seleccionados relevantes para la biología molecular y la inmunología .

Muchos ARNnc actúan en redes (por ejemplo, redes de ARN competidoras endógenas o ceRNA que conectan miRNA, lncRNA y circRNA).

  1. ARNnc constitutivos (funciones estructurales y catalíticas) Estos son abundantes, altamente conservados y críticos para las funciones celulares básicas.
  • ARN ribosómicos (rRNA): Componentes centrales de los ribosomas (p. ej., 18S, 5,8S, 28S y 5S en eucariotas). Catalizan la formación del enlace peptídico durante la traducción ( actividad ribozima) y proporcionan el andamiaje estructural para la síntesis proteica.
  • ARN de transferencia (tRNA): Moléculas adaptadoras que decodifican codones del ARNm y entregan aminoácidos específicos al ribosoma. Algunos se procesan en fragmentos derivados de tRNA (tRFs/ tiRNAs) que regulan la traducción bajo estrés.
  • ARN nucleares pequeños (snRNA, ej., U1–U6): Componentes del espliceosoma. Reconocen sitios de corte y empalme, catalizan la escisión de intrones y permiten la ligación de exones en el pre-ARNm. Su desregulación se asocia a defectos de empalme en enfermedades neurodegenerativas.
  • ARN nucleolares pequeños (snoRNA): Guían modificaciones químicas específicas de sitio en rRNA, tRNA y snRNA (caja C/D: 2′-O-metilación; caja H/ACA: pseudouridilación). Algunos también regulan el empalme alternativo o actúan como precursores de miRNA.

 

  1. ARNnc reguladores pequeños (<200 nt) Actúan principalmente a nivel post-transcripcional.
    • MicroARN (miRNA, ~22    nt):   Se  incorporan alcomplejo de silenciamiento inducido por ARN (RISC). Se unen a secuencias parcialmente complementarias (a menudo en las regiones 3′ UTR) de ARNm diana, lo que conduce a la represión traduccional o a la degradación del ARNm. Cada miRNA puede regular cientos de dianas, controlando el desarrollo, la apoptosis, el metabolismo y las respuestas al estrés.
  • ARN de interferencia pequeños (siRNA, ~21–25 nt): Complementarios perfectos a sus dianas; desencadenan la escisión y degradación del ARNm mediada por RISC (defensa endógena o antiviral). Se utilizan ampliamente de forma experimental para el silenciamiento génico.
  • ARN que interactúan con Piwi (piRNA, ~26–31 nt): Se unen a proteínas PIWI; silencian principalmente elementos transponibles (mediante metilación del ADN y modificación de histonas) para mantener la estabilidad genómica en la línea germinal. Existen roles somáticos emergentes en células cerebrales e inmunes.

Nota de inmunología: Los miRNA son reguladores maestros del destino y la función de las células inmunes (p. ej., miR-155 promueve la activación de células T y B, la formación de centros germinales y la producción de citocinas; miR-146a atenúa la señalización NF-κB y la inflamación para prevenir la autoinmunidad).

  1. ARN no codificantes largos (lncRNA, >200 nt)

Altamente diversos en secuencia, estructura y localización (nuclear, citoplásmica o ambas). A menudo de baja abundancia, escasamente conservados y expresados de manera específica de tipo celular. Actúan mediante múltiples mecanismos: andamiaje de complejos proteicos, guía de modificadores de cromatina, función de señuelo/esponja o formación de condensados nucleares.

  • Mecanismos clave:
    • Regulación transcripcional cis/trans: Reclutan remodeladores de cromatina (p. ej., Polycomb, histona acetiltransferasas) o factores de transcripción.
  • Control epigenético: Modulan la metilación del ADN y las marcas de histonas (p. ej., Xist recubre el cromosoma X para su inactivación mediante complejos represores).
    • Post-transcripcional: Influyen en el empalme, la estabilidad o la traducción de ARNm; actúan como esponjas de miRNA (actividad ceRNA).

 

  • Arquitectura nuclear: Organizan paraspeckles (NEAT1) u otros orgánulos sin membrana; forman bucles promotor-enhancer (eRNA).
  • Subtipos y ejemplos:
    • lincRNA (largos intergénicos): p. ej., HOTAIR (regulación de genes HOX vía Polycomb).
  • Antisentido: Solapan genes codificantes de proteínas (p. ej., BACE1-AS estabiliza el ARNm del precursor amiloide en la enfermedad de Alzheimer).
  • ARN de enhancer (eRNA): Promueven la actividad de los enhancers y el plegamiento de la
  • circRNA (circulares, formados por retroempalme): Altamente estables; actúan como potentes esponjas de miRNA (p. ej., ciRS-7 secuestra miR-7), regulan el empalme y la traducción o sirven de andamiaje

Nota de inmunología: Los lncRNA emergen como orquestadores clave de la inmunidad innata y adaptativa, del ciclo cáncer-inmunidad y de la autoinmunidad. Ejemplos incluyen NEAT1 (formación de paraspeckles, señalización inmune innata, polarización de macrófagos) y MALAT1 (regula la tolerancia de células dendríticas vía miR-155, modula la inflamación y las respuestas de células T). Influyen en la señalización de  citocinas,  las  respuestas  de  interferón,  la diferenciación de células T y B, y la evasión inmune tumoral.

Temas emergentes y consideraciones

  • Interacción cruzada: Los miRNA, lncRNA y circRNA compiten por parejas de unión compartidas (redes ceRNA).
  • Micropéptidos: Un subconjunto de lncRNA contiene marcos de lectura abiertos pequeños (sORF) que codifican péptidos funcionales.
  • Enfermedad y terapia: Desregulación generalizada en cáncer, neurodegeneración, autoinmunidad e inflamación; muchos sirven como biomarcadores o dianas terapéuticas (p. ej., miméticos/inhibidores de miRNA, silenciamiento de lncRNA mediante ASO o CRISPR).
  • Desafíos: Miles de lnc RNA permanecen sin caracterizar funcionalmente; sus funciones son a menudo dependientes del contexto y difíciles de predecir únicamente a partir de la

•     LA DIVERSIDAD GENÉTICA HUMANA

La diversidad genética humana entre poblaciones (estudiada con frecuencia mediante grupos de ascendencia genética que corresponden a orígenes continentales principales o agrupaciones étnicas) ha sido

 

cuantificada de manera exhaustiva a través de proyectos de secuenciación a gran escala. Entre ellos se encuentran el Proyecto 1000 Genomas (2015), el Panel de Diversidad del Genoma Humano (HGDP), la secuenciación de 929 genomas diversos de Bergström et al. (2020) y gnomAD v4/v4.1 (2023–2024, ~807 000

individuos con representación ampliada de poblaciones no europeas). Los datos a 2026 (incluidos subconjuntos armonizados de HGDP/1kG y estudios recientes de genomas completos africanos y asiáticos) confirman patrones estables: los humanos presentan una diversidad genética global baja en comparación con muchas especies, con la mayor parte de la variación dentro de los grupos más que entre ellos.

  1. La diversidad genética humana global es baja y clinal
  • Dos humanos no emparentados difieren en aproximadamente el 0,1 % de los sitios nucleotídicos (diversidad nucleotídica π ≈ 0,001, o una diferencia cada 1 000 bases en promedio). Un genoma típico difiere de la referencia GRCh38 en 4,1–5,0 millones de sitios (principalmente SNP e indels pequeños), lo que afecta a ~20 millones de bases cuando se incluyen variantes

 

  • La diversidad es clinal (gradientes graduales con la geografía) y no discreta. Los análisis de componentes principales (PCA) y los modelos de admixture (p. ej., ADMIXTURE) revelan agrupaciones continentales amplias (africana, europea, este asiática, surasiática, americana mestiza, etc.), pero no existen límites genéticos nítidos entre «razas». Existen miles de grupos étnicos distintos en todo el mundo; la genómica suele analizar 50–100 poblaciones representativas o 5–7 supergrupos de ascendencia principales.
  1. Distribución de la variación: mayoritariamente dentro de las poblaciones
  • Resultado clásico (Lewontin 1972, con polimorfismos proteicos) y confirmaciones modernas de genomas completos: ~85 % (rango 80–95 %) de la variación genética neutra ocurre dentro de las poblaciones, ~8– 15 % entre poblaciones dentro de los continentes y solo ~6–15 % entre los principales grupos de ascendencia continental.
  • Esto se cumple para SNP, indels y la mayoría de las variantes de secuencia. Las variantes raras o de baja frecuencia (<5 % de frecuencia alélica) muestran una diferenciación geográfica más fuerte que las comunes.
  • F_ST (índice de fijación, medida de diferenciación):

 

  • Entre ascendencias continentales principales: típicamente 0,10–0,16 (p. ej., África–Europa ≈0,14; Europa–Este de Asia ≈0,11; África–Este de Asia ≈0,16).
  • Dentro de los continentes: mucho menor (a menudo <0,01 en Europa; mayor en el sur de Asia, ~0,072 en general debido a endogamia/castas, con algunas parejas tribales hasta 0,15).
  1. Máxima diversidad en poblaciones africanas; disminución con la distancia de Africa
  • Las poblaciones subsaharianas (especialmente cazadores-recolectores como los san) muestran consistentemente la mayor diversidad genética:
    • Diversidad nucleotídica (π) y heterocigosidad: ~1,0–1,2 × 10⁻³ en africanos frente a ~0,7–0,8 × 10⁻³ en no africanos.
  • Variantes por individuo: los africanos promedian ~6,1 millones de SNV por genoma; los no africanos ~5,3 millones (un subconjunto de la variación africana debido al cuello de botella Out-of-Africa ~50–70 ka).
  • La mayoría   de   las  variantes   privadas, raras  y singletons son específicas de África.
  • La diversidad no africana disminuye por efectos fundadores seriales durante las migraciones (p. ej., mínima en algunos grupos indígenas americanos o aislados).

 

  • Los esfuerzos recientes de lectura larga y pangenoma (incluidas las expansiones de gnomAD) confirman que los africanos aportan la mayor parte de la novedad en secuencia y variantes estructurales.
  1. Patrones de escala fina y específicos de ascendencia
  • Sur de Asia (alta endogamia): F_ST global moderado (~0,072); los grupos tribales presentan menor heterocigosidad y mayor número de tramos de homocigosidad que los grupos de casta.
  • Poblaciones mestizas (p. ej., América Latina): la inferencia de ascendencia local en gnomAD revela frecuencias alélicas específicas de ascendencia incluso dentro de individuos.
  • Variantes raras y estructurales: mayor diferenciación poblacional; muchas son privadas de grupos étnicos específicos debido a deriva, efectos fundadores o selección local.
  • gnomAD v4 (con un aumento de ~3 veces en muestras no europeas) muestra un descubrimiento dramáticamente mayor de variantes comunes (>0,1 % de frecuencia) en ascendencias africana, este asiática y surasiática en comparación con conjuntos de datos anteriores sesgados hacia Europa.

 

  1. Caso especial: genes relevantes para inmunología
    • Los genes sometidos a selección impulsada por patógenos (p. , HLA/MHC, citocinas, vías de interferón) muestran mayor diferenciación entre poblaciones que los loci neutros. Los alelos HLA son extremadamente polimórficos y a menudo específicos de ascendencia, reflejando historias locales de enfermedades infecciosas.
    • Esto tiene relevancia directa para el emparejamiento de trasplantes, la respuesta a vacunas y el riesgo de autoinmunidad entre grupos étnicos.

Conclusiones clave y salvedades (a 2026)

  • No existe evidencia para la existencia de «razas» biológicas en sentido taxonómico: la variación es continua y las diferencias entre grupos son pequeñas en relación con las que ocurren dentro de los grupos. Sin embargo, la ascendencia es biológicamente significativa para las frecuencias alélicas, las puntuaciones de riesgo poligénico y la medicina de precisión.
  • Bases de datos como gnomAD (frecuencias estratificadas por ascendencia), 1000 Genomas/HGDP y el Consorcio de Referencia del Pangenoma Humano constituyen los recursos de estándar oro para análisis conscientes de la ascendencia.

 

  • Sesgos persistentes: las ascendencias europeas siguen sobrerrepresentadas, pero los esfuerzos recientes (gnomAD v4, All of Us, iniciativas africanas de genomas) están cerrando la brecha y revelando una biología más específica de cada población.

Estos patrones surgen de la historia evolutiva humana (Out-of-Africa, cuellos de botella, admixture y selección). Para aplicaciones en inmunología o biología molecular, utilícese siempre paneles de referencia emparejados por ascendencia.

A partir del conjunto completo de datos genéticos y genómicos (incluidos los patrones discutidos: ~85–95 % de variación neutra dentro de las poblaciones, valores de F_ST de 0,10–0,16 entre ascendencias continentales principales, estructura clinal en lugar de discreta y gradientes continuos de frecuencias alélicas modelados por migraciones Out-of-Africa y admixture), el consenso científico es que los humanos constituyen una única especie biológica (Homo sapiens) sin razas taxonómicas válidas en el sentido de subgrupos discretos y biológicamente delimitados.

Esta conclusión ha sido estable y reiteradamente reafirmada a través de proyectos de secuenciación a gran escala (1000 Genomes, HGDP, gnomAD, All of Us, Human  Pangenome)  hasta  2026.  Los  principales organismos científicos —incluidas las Academias Nacionales de Ciencias, Ingeniería y Medicina (informes 2024–2025), la American Society of Human Genetics y revisiones en Science, Nature y BBC Future— afirman explícitamente que la raza no constituye una categoría biológicamente significativa para los humanos. No existen diferencias genéticas fijas que definan los agrupamientos raciales tradicionales; en cambio, la variación es abrumadoramente continua y geográfica.

Los datos científicos respaldan firmemente la idea de que todos los humanos pertenecen a una sola especie, a pesar de las diferencias étnicas y ancestrales.

  • Ausencia de agrupaciones genéticas discretas = ausencia de razas biológicas: los análisis de componentes principales y los modelos de admixture revelan agrupaciones continentales amplias de ascendencia, pero estas son difusas, superpuestas y jerárquicas (siempre es posible definir agrupaciones más finas o más gruesas). No existen límites nítidos ni alelos privados que definan de manera única a las «razas». Los rasgos utilizados históricamente para la clasificación racial (color de piel, textura del cabello, etc.) están controlados por una fracción mínima de loci bajo selección local y no predicen el resto del

 

  • Variación dentro del grupo >> variación entre grupos: tal como Lewontin cuantificó por primera vez en 1972 y todos los estudios de genomas completos han confirmado, la gran mayoría de la diversidad genética humana ocurre dentro de cualquier población o grupo étnico autoidentificado. Las diferencias entre grupos (incluso a escala continental) son modestas y clinales — gradientes que siguen la historia migratoria más que categorías fijas.
  • Los grupos étnicos/ascendencia como descriptor preciso: la etnia autoidentificada, la ascendencia geográfica o la ascendencia inferida genéticamente (mediante herramientas como ADMIXTURE o PCA) sí capturan patrones reales, médicamente y evolutivamente relevantes ( ej., frecuencias alélicas para farmacogenómica, diversidad HLA, loci de resistencia a patógenos). Estos no son «razas», sino poblaciones moldeadas por la historia, la deriva, los efectos fundadores y la adaptación local. Los grupos étnicos suelen alinearse parcialmente con agrupaciones genéticas debido a la endogamia y los orígenes geográficos compar t idos, pero siguen siendo principalmente construcciones socioculturales con correlatos genéticos parciales.

Matices importantes (no contradicciones)

 

  • La estructura poblacional es real y útil: las pruebas forenses de ascendencia, las puntuaciones de riesgo poligénico y el emparejamiento de trasplantes funcionan precisamente gracias a las diferencias detectables de ascendencia. Estas simplemente no equivalen a razas biológicas discretas.
  • Ausencia de subespecies taxonómicas: a diferencia de otros mamíferos, los humanos muestran una diferenciación demasiado escasa (y un flujo génico histórico excesivo) para justificar una clasificación en subespecies o razas según los conceptos biológicos de
  • El consenso no es una negación política de las diferencias: los datos reconocen clines fenotípicos visibles, riesgos de enfermedad específicos de ascendencia y diversidad de genes Simplemente rechazan la idea de que estos se correspondan con las razas definidas socialmente como unidades biológicamente coherentes.

En resumen, los datos genéticos combinados con todos los estudios posteriores de genomas completos, pangenoma y estratificados por ascendencia hasta 2026 permiten una conclusión clara: biológicamente, existe una sola raza humana (nuestra única especie) con una diversidad estructurada que se describe mejor mediante grupos étnicos, poblaciones ancestrales y clines geográficos. Esta es la posición de la genómica y la genética de poblaciones mainstream.

Resumen breve:

UNA SOLA RAZA HUMANA:

  • Biológicamente: sí, los datos genómicos (del Proyecto 1000 Genomas, gnomAD, HGDP y todo el trabajo posterior de pangenoma hasta 2026) muestran una única especie humana (Homo sapiens) con variación continua y clinal que se describe mejor mediante grupos étnicos/ancestrales en lugar de razas biológicas

NINGUNA EVIDENCIA DE LA NECESIDAD DE

DIOS/SUPERINTELIGENCIA EN LA CREACIÓN DEL CÓDIGO COMPLEJO DEL ADN:

  • Complejidad del código genético/ADN: la evidencia procedente de la genómica comparativa, la filogenómica y los estudios recientes de 2024–2026 sobre la evolución del código respalda plenamente un origen natural y gradual; no existe necesidad científica de invocar una superinteligencia.

 

CÓMO SE  GENERÓ EL COMPLEJO CÓDIGO GENÉTICO

 

La evolución del código genético es uno de los temas centrales de la biología molecular y evolutiva. El código genético —el conjunto de reglas que relaciona los tripletes de nucleótidos (codones) del ARNm con los 20 aminoácidos canónicos y las señales de terminación— es prácticamente universal en todos los dominios de la vida (bacterias, arqueas y eucariotas), lo que constituye una de las evidencias más robustas de un ancestro común universal (LUCA, por sus siglas en inglés) que existió hace unos 4 000 millones de años.

  1. Contexto histórico: del “mundo de ARN” a la traducción moderna

El código no surgió de forma completa y súbita. La hipótesis dominante propone que la vida primitiva se desarrolló en un mundo de ARN, donde el ARN actuaba simultáneamente como material genético y como catalizador (ribozimas). En esta etapa prebiótica, moléculas de ARN más simples pudieron haber interactuado directamente con aminoácidos mediante afinidades estereoquímicas (afinidades químicas entre bases y aminoácidos). La aparición de los primeros ARNt (ARN de transferencia) y aminoacil- ARNt sintetasas (aaRS) permitió la transición hacia un sistema de traducción dependiente de proteínas. Este proceso fue  gradual  y  ocurrió  en  etapas  evolutivas, probablemente a través de mecanismos de transferencia horizontal entre protocélulas primitivas, antes de que se estabilizara la herencia vertical.

  1. Modelos principales de evolución del código

Varios modelos explican cómo se llegó al código estándar actual (64 codones para 20 aminoácidos + 3 de parada):

  • Modelo de afinidades estereoquímicas: Ciertos aminoácidos se unían preferentemente a codones específicos por razones químicas
  • Modelo de co-evolución biosintética: Los aminoácidos más complejos se incorporaron más tarde, derivados biosintéticamente de los más simples (p. ej., a partir de precursores metabólicos).
  • Modelo de minimización de errores: El código evolucionó para reducir el impacto de mutaciones y errores de traducción. Los aminoácidos con propiedades químicas similares (hidrofóbicos, polares, etc.) están codificados por codones similares, lo que minimiza los efectos deletéreos de cambios de una sola base.

 

Ninguno de estos modelos es excluyente; la evidencia actual sugiere una combinación de ellos.

  1. Evidencia reciente (2024-2026): reclutamiento gradual de aminoácidos

Estudios filogenómicos y proteómicos han refinado el orden de incorporación:

  • Un estudio de 2024 en PNAS (Wehbi et al., Universidad de Arizona) analizó dominios proteicos ancestrales del LUCA y concluyó que los aminoácidos más pequeños y simples (glicina, alanina, etc.) se incorporaron primero. Los aminoácidos más grandes y químicamente complejos se añadieron Además, los aminoácidos que se unen a metales (como cisteína) aparecieron antes de lo que se pensaba en el consenso anterior. Este trabajo revisa la visión tradicional del orden de reclutamiento y enfatiza un proceso impulsado por la estructura de proteínas tempranas.
  • Investigaciones de 2025 (Caetano-Anollés y colaboradores, Universidad de Illinois) se centraron en la cronología de dipeptidos (pares de aminoácidos) en proteomas Demostraron una sincronía notable entre dipeptidos y anti-dipeptidos, lo que sugiere que el código primitivo surgió de la co-evolución bidireccional entre proteínas incipientes y el aparato de traducción (un “código proteico primordial” paralelo al código de ARN).
  • Modelos como el “Mundo de Alanina” (Budisa et al., 2026) proponen que un conjunto reducido de aminoácidos versátiles (glicina, alanina, prolina) sirvió de andamiaje inicial, validado experimentalmente con proteínas sintéticas

Estos datos indican un origen paso a paso, impulsado por selección química, metabólica y de estabilidad proteica, sin necesidad de mecanismos no naturales.

  1. Variabilidad natural  y  evolvabilidad  del código

El código no es inmutable. La revisión de 2025 en Current Biology (Lukeš et al.) documenta más de 50 variantes naturales en organismos y orgánulos (mitocondrias, cloroplastos y algunos microbios). Ejemplos recientes incluyen códigos expandidos en arqueas metanógenas, donde el codón de parada UAG se reasigna sistemáticamente para codificar pirrolisina (un aminoácido inusual), un cambio que ha surgido de forma independiente múltiples veces y que está ligado a ventajas metabólicas (consumo de metilaminas).

Estos ejemplos demuestran que el código puede cambiar bajo presión selectiva y relajación en genomas pequeños, refutando la idea de que está “congelado” de forma irreversible.

  1. Evidencia experimental: biología sintética

La biología sintética confirma la evolvabilidad:

  • El laboratorio de Chin (2025) creó coli Syn57, un organismo viable con un genoma de solo 57 codones (tras más de 100 000 cambios dirigidos), demostrando que se pueden reescribir masivamente los códigos sin perder funcionalidad.
  • Modelos de IA como Evo 2 (2026) entrenados en billones de bases de ADN de >100 000 especies predicen y generan secuencias funcionales, mostrando que los patrones del código son aprendibles y predecibles a partir de principios evolutivos.

 

Conclusión

La evolución del código genético fue un proceso natural, gradual y selectivo que se inició en un mundo de ARN primitivo y se estabilizó mediante co-evolución química, metabólica y proteica. Los estudios más recientes (2024-2026) refuerzan que el orden de incorporación de aminoácidos, las propiedades de minimización de errores y las variaciones observadas son plenamente exp l i c a b le s p o r m e c a n i s m o s  d a r w in ia n o s  y fisicoquímicos. No existe evidencia científica que requiera invocar una superinteligencia; por el contrario, la combinación de filogenómica, proteómica y biología sintética muestra un origen completamente coherente con la evolución.