«No lo sé»: La frase que la inteligencia artificial todavía no aprende… y la medicina ya nos está alertando

eju.tv

Ronald Palacios Castrillo, M.D.,PhD.

=> Recibir por Whatsapp las noticias destacadas

No me avergonzaré de decir “no lo sé”.

— Juramento Hipocrático.

En los últimos meses, he consultado con mucha frecuencia a Grok, como si fuera un colega médico, sobre casos complejos y temas muy actualizados. En general, la experiencia ha sido excelente: respuestas sólidas, bien fundamentadas y con referencias bibliográficas útiles. Siempre las revisé con atención, como debe hacerse.

Sin embargo, esto me llevó a una reflexión importante: ¿son capaces Grok y otras inteligencias artificiales de decir sinceramente «No lo sé», como lo haría un buen médico cuando se enfrenta a algo que realmente desconoce?

Este artículo nace de esa pregunta.

Imagina esta situación:

A una residente de primer año le preguntan: «¿Qué explica la elevación de creatinina de este paciente?». Ella hace una pausa y responde con humildad: «No lo sé…».

El equipo revisa los medicamentos, evalúa los riesgos y decide un plan cauteloso: medir niveles farmacológicos y consultar a Nefrología. Todo fluye mejor gracias a esa honesta admisión.

Ahora ponemos el mismo caso a un sistema de inteligencia artificial clínico. La IA busca artículos, reúne información… y entrega una respuesta confiada y segura, aunque la evidencia sea contradictoria y no encaje perfectamente con el paciente real.

Aquí está el problema: existen pocos errores más peligrosos que equivocarse con total convicción.

Se espera que los médicos reconozcan sus límites. En cambio, la mayoría de las herramientas de IA actuales parecen incapaces —o poco dispuestas— a hacer lo mismo.

En un estudio donde se presentaron 300 casos clínicos reales a diferentes modelos de IA, estos aceptaron y amplificaron información falsa entre el 50 % y el 82 % de las veces. Casi ninguno dijo «no lo sé» (1).

Los sistemas de IA se entrenan principalmente para dar respuestas, no para abstenerse. Sin embargo, si realmente queremos que apoyen el trabajo médico, deben aprender a expresar incertidumbre.

Los médicos manejan varios tipos de incertidumbre: falta de conocimiento, evidencia incompleta, dificultad para predecir resultados o diferencias de valores con el paciente. Decir «no lo sé» no es debilidad; es lo que permite pasar del pensamiento rápido e intuitivo a un razonamiento más cuidadoso y seguro (2).

Esa humildad se llama humildad epistémica: la combinación de autoconciencia, honestidad intelectual y reconocimiento claro de los propios límites. Es una de las virtudes más importantes de un buen clínico.

Las IA actuales no tienen esta capacidad de forma natural. Son excelentes prediciendo palabras, pero no “saben” lo que ignoran. Pueden simular la frase «no lo sé», pero sin que realmente refleje sus verdaderas limitaciones. Eso puede ser tan peligroso como dar una respuesta equivocada con excesiva confianza.

Entonces, ¿qué podemos hacer?

Propongo una idea concreta: incorporar la capacidad de decir «No lo sé» cuando corresponde como una competencia clínica esencial, tanto para médicos en formación como para sistemas de IA.

En la educación médica ya existen las “Actividades Profesionales Confiables” (APC). Son habilidades concretas y observables que demuestran que alguien está listo para mayor responsabilidad. Sugiero que “reconocer y expresar explícitamente la incertidumbre” se convierta en una de estas competencias clave, aplicable también a la inteligencia artificial.

De esta forma, podríamos evaluar a las IA de la misma manera que evaluamos a los residentes: observando si detectan cuándo deben detenerse, pedir más información o admitir que no tienen suficiente certeza.

Aún queda mucho camino por recorrer. Hoy existen herramientas técnicas para que la IA exprese incertidumbre, pero todavía no se usan de forma habitual en los sistemas clínicos. Es necesario definir estándares claros: cuándo debe decir “no lo sé”, cómo expresarlo y cómo los hospitales deben verificar que esa señal sea confiable.

Los sistemas de IA ya han superado muchas pruebas difíciles. Ahora enfrentan una prueba más importante y humana:

¿Serán capaces de reconocer lo que no saben?

En medicina, la respuesta a esa pregunta puede marcar la diferencia entre la seguridad y el error. Por eso la medicina ya nos está alertando… y es hora de que la inteligencia artificial escuche.

Referencias Bibliográficas

Omar M, Sorin V, Collins JD, et al. Multi-model assurance analysis showing large language models are highly vulnerable to adversarial hallucination attacks during clinical decision support. Commun Med (Lond) 2025;5:330-330.

Pusic MV, Santen SA, Dekhtyar M, et al. Learning to balance efficiency and innovation for optimal adaptive expertise. Med Teach 2018;40:820-827.

Ilgen JS, Dhaliwal G. Educational strategies to prepare trainees for clinical uncertainty. N Engl J Med 2025;393:1624-1632.

Cooper D, Holmboe ES. Competency-based medical education at the front lines of patient care. N Engl J Med2025;393:376-388.

Henry K, Smith B, Zhao X, et al. Drug or Pokémon? An analysis of the ability of large language models to discern fabricated medications. January 13, 2025 (https://www.medrxiv.org/content/10.64898/2026.01.12.26343930v1).