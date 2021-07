Images Generated By AI Machines es una cuenta de Twitter creada hace dos semanas que ya ha tuiteado o retuiteado cientos de imágenes generadas mediante inteligencia artificial. Pero no estamos ante el típico generador de rostros, cuyo fin es el de producir imágenes realistas e indistinguibles de la realidad, no.

Por el contrario, esta cuenta ofrece imágenes que se ajusten a una breve descripción (más bien, una o algunas pocas palabras clave) proporcionada por el usuario. Recurriendo a lo ‘aprendido’ durante su entrenamiento con miles de imágenes reales, el algoritmo elabora desde cero una imagen que, a su ‘entender’, se ajusta a la descripción.





En muchos casos, las descripciones son aportaciones de los seguidores de la cuenta que, a modo de peticiones del público, sus administradores van seleccionando y publicando. En otros casos, se limitan a retuitear imágenes generadas por otros usuarios que hacen uso de la misma IA.

Si bien en algunos casos el resultado resulta ridículo o ininteligible, en la mayoría de las imágenes resulta fascinante —e incluso hipnótico— apreciar el resultado y cómo éste se relaciona con los conceptos introducidos: se hace evidente que existe un abismo inquietante entre la imaginación humana y la ‘imaginación artificial’, pese a que ésta se inspire en la primera.

Estos androides no sueñan con ovejas eléctricas…

Veamos algunos ejemplos:

Además, en algunos casos publican también vídeos que nos permiten apreciar el ‘proceso de elaboración’ de la imagen. En este caso, muestra cómo se proporciona una determinada imagen base, que el algoritmo irá modificando hasta ajustarse a la descripción dada. Como en el siguiente ejemplo…

Vídeo de «Piscina retrowave»… generada a partir de la foto de una mano:

¿Qué tecnología hay detrás de estas pesadillas?

La clave del funcionamiento de esta IA son lo que denominamos GANs o ‘redes generativas antagónicas‘. Damos ese nombre a parejas de redes neuronales que —simplificando un poco el mecanismo— compiten entre ellas: una de ellas (que llamamos ‘generativa’) elabora una imagen, y la otra (la ‘discriminadora’) le responde con el grado de parecido que ésta tiene con otras (las de entrenamiento, aportadas por seres humanos) con descripciones similares.

A continuación, la primera retoca la imagen buscando que la segunda juzgue superior el grado de semejanza de ésta. Y así, una y otra vez hasta que resulta imposible para la primera mejorar la imagen resultante.

En este caso, la tecnología usada para crear estas imágenes se ha bautizado como Big Sleep, el resultado de combinar una GAN (la conocida como BigGAN) con CLIP (Contrastive Language Image Pretraining), una IA responsable de convertir textos en imágenes, desarrollada por los creadores del famoso y potente GPT-3.