Hace algunas semanas, la Fundación ARC Prize lanzó ARC-AGI-3, un nuevo estándar de evaluación para el razonamiento en inteligencia artificial


 

 



Ronald Palacios Castrillo, M.D.,PhD.

 

=> Recibir por Whatsapp las noticias destacadas

El modelo de IA más avanzado alcanza una puntuación de tan solo el 0,37 %. Los seres humanos, en cambio, obtienen el 100 %(ver figura abajo)

No se trata de un error tipográfico. La brecha que separa el razonamiento humano del de los sistemas de inteligencia artificial ante problemas novedosos sigue siendo de una magnitud extraordinaria.

ARC-AGI-3 ha eliminado por completo los rompecabezas estáticos. En su lugar, sitúa a los agentes de IA en entornos de juegos interactivos que carecen de instrucciones, de reglas y de objetivos explícitos. Dichos agentes deben explorar autónomamente, descubrir las mecánicas subyacentes, identificar las condiciones de victoria y aplicar lo aprendido en niveles de dificultad progresivamente mayores.

Los seres humanos son plenamente capaces de realizar esta tarea. Los modelos de IA, en cambio, no lo logran de manera efectiva.

Esta cuestión reviste una importancia fundamental, puesto que todos los demás estándares de evaluación se limitan a comprobar si un modelo puede recuperar patrones memorizados durante su fase de entrenamiento. ARC-AGI-3, por el contrario, examina si un modelo es capaz de aprender de la experiencia en tiempo real. Se trata de una competencia cualitativamente distinta y, en la actualidad, la respuesta sigue siendo negativa: prácticamente no.

Si bien los modelos registran avances acelerados en ámbitos como el reconocimiento de patrones, la recuperación de información y la optimización, el aprendizaje desde cero en un entorno desconocido continúa siendo una facultad propia y exclusiva del cerebro de los seres humanos.

En mi humilde opinión, la AI nunca va a igual al cerebro humano en este tipo de actividad intelectual y razonamiento. Tampoco, nunca conseguirá tener conciencia (el saber que ES y Existe y saber que sabe que Existe y ES).