Detalles y novedades de la nueva IA que pasa de texto a Imagen

Google presentó su modelo de creación de imágenes más avanzado hasta la fecha: Imagen 3. Este anuncio se realizó durante la conferencia de desarrolladores Google I/O, y ya está causando un gran revuelo en la comunidad tecnológica.

Douglas Eck, director de investigación de Google DeepMind, destacó que Imagen 3 no solo mejora en términos de calidad fotográfica, sino que también entiende mejor los prompts escritos de manera natural. Esto significa que mientras más creativa y detallada sea la descripción, mejores serán los resultados generados por la IA.



Imagen 3 se destaca por su capacidad para generar imágenes con una calidad fotorealista impresionante, incorporando detalles que sus predecesores no podían manejar. Los errores visuales y las distorsiones, que eran un problema común en modelos anteriores, se han reducido significativamente en esta versión.

Como decía, uno de los avances más notables de Imagen 3 es su habilidad para manejar prompts largos y complejos. La IA recuerda e incorpora pequeños detalles en estos prompts, ofreciendo resultados que son sorprendentemente precisos y detallados. Esta mejora es especialmente útil para aquellos que buscan crear imágenes altamente específicas y detalladas.

Aunque actualmente está disponible en vista previa privada para creadores selectos a través de ImageFX, Google ha anunciado que los desarrolladores pueden inscribirse en una lista de espera. Además, Imagen 3 estará disponible en Vertex AI próximamente, expandiendo así su accesibilidad y utilidad en diversas aplicaciones.

Competencia en el Mercado de IA

Google no es el único jugador en el campo de la generación de imágenes por IA. Empresas como OpenAI con DALL-E, Midjourney, Adobe con Firefly, Meta y Microsoft con Designer también están desarrollando herramientas similares. La competencia es feroz, y cada empresa busca ofrecer el modelo más avanzado y preciso.

El mercado ha visto una explosión de innovaciones en la generación de imágenes. Desde la generalización de Imagen 2 hace seis meses, hasta la incorporación de capacidades de texto a vivo en abril, Google ha trabajado arduamente para mantenerse a la vanguardia. Pero no todo ha sido perfecto para Google. A principios de este año, la compañía enfrentó críticas cuando su IA generó imágenes controvertidas de figuras históricas con representaciones raciales inesperadas. Este incidente llevó a Google a emitir disculpas públicas y reafirmar su compromiso con la precisión y la sensibilidad cultural. El CEO de Google, Sundar Pichai, abordó el tema en una entrevista con Emily Chang de Bloomberg, subrayando que la empresa está trabajando para mejorar sus algoritmos y evitar errores similares en el futuro.

Recordad que, además de Imagen 3, Google también presentó un nuevo modelo de generación de video llamado Veo durante el evento Google I/O. Este avance abre nuevas posibilidades para la creación de contenido visual dinámico, ampliando aún más las capacidades de la inteligencia artificial en el ámbito creativo.

Fuente: Link