Apenas aproximadamente medio año después de que OpenAI revolucionara el sector tecnológico con la puesta de largo de ChatGPT (versión GPT-3.5) a finales de noviembre de 2022, se produjo el lanzamiento de GPT -4. Pero aunque la empresa liderada por Sam Altman (con sus altibajos) todavía se encuentra depurando su último modelo de lenguaje, el nuevo GPT-5 ya está gestándose.

En este artículo recopilamos toda la información disponible de GPT-5, el próximo gran proyecto de inteligencia artificial de OpenAI, como su fecha de lanzamiento, cómo funcionará o sus novedades.

¿Cuándo se lanzará GPT-5?

Aunque no existe una fecha oficial de lanzamiento y ya no tiene sentido considerar esos cinco meses largos de diferencia entre GPT-3.5 y GPT-4 como referencia, Sam Altman ha ido dejando pistas.

En agosto de 2023 el CEO de OpenAI explicaba que no estaban entrenando una futura GPT-5 y que no lo harían durante un tiempo. En septiembre seguía en la misma línea, asegurando que ‘Todavía tenemos mucho trabajo por hacer antes de llegar a GPT-5. Se necesita mucho tiempo para eso: aún no estamos cerca. Se necesitan más auditorías de seguridad.’

Que todavía no lo estuvieran entrenando entonces no implica que no lo hagan ahora y en cualquier caso, GPT-5 ya estaba en el horno: precisamente ese mes se conoció que el 18 de julio de 2023 presentaron la solicitud para registrar la marca en la oficina de patentes estadounidense. No obstante, la resolución puede llevar meses.

Recapitulando: GPT-3 se lanzó en mayo de 2020, GPT-3.5 en noviembre de 2022 y GPT-4 en marzo de 2023 y en cuanto a GPT-5, los rumores apuntan a un lanzamiento durante los próximos meses, si bien estos mensajes llamando al conservadurismo y la paciencia provienen no solo por lo colosal del proyecto, sino también porque han ralentizado la innovación en busca de mejorar su rentabilidad.

¿Qué novedades tendrá GPT-5?

De la solicitud de patentes de GPT-5 sabemos que OpenAI ha vinculado su próximo gran lanzamiento con un vasto número de campos tecnológicos, desde «programas informáticos descargables y software para usar modelos de lenguaje» hasta software para «la producción artificial de voz y texto humanos». Asimismo se destacan posibles características como «procesamiento, generación, comprensión y análisis del lenguaje natural» y las funciones de traducción de texto y voz de un idioma a otro, y software para aprendizaje automático y análisis predictivo que comparten conjuntos de datos.



Vía WindowsLatest

Cuando Sam Altman fue invitado a ‘Unconfuse Me’, el podcast de Bill Gates, en enero de 2024, el CEO de OpenAI explicó que están enfocados en lograr que sus modelos de lenguaje ofrezcan diversas habilidades, como la posibilidad de conversar con ChatGPT mediante la voz, ofrecer herramientas para imágenes y vídeo, precisamente este último una característica desconocida en sus modelos actuales. En pocas palabras, que será más multimodal que nunca, al estilo de Gemini Ultra de Google.

Otro área de progreso importante para OpenAI es la capacidad de razonamiento, ya que según Altman, GPT-4 puede razonar de forma muy limitada a día de hoy, por lo que espera que GPT-5 destaque más ampliamente en este aspecto.

El tercer gran pilar de GPT-5 será la fiabilidad. Altman explicaba en su charla con Bill Gates que ‘Si le haces una pregunta a GPT-4 10.000 veces, probablemente una de esas 10.000 sea bastante buena, pero no siempre sabrá cuál’, por lo que la idea es seguir subiendo ese porcentaje para ganar en confiabilidad.

El otro as en la manga para GPT-5 será la adaptabilidad y personalización en aras de satisfacer la demanda de usuarios y usuarias, así como en el ámbito empresarial. Altman detallaba que ‘La gente quiere cosas muy diferentes de GPT-4, estilos diferentes, y nosotros haremos que todo eso sea posible; también utilizando sus propios datos, como conectarse a su calendario, el correo electrónico puede mejorar el modelo de IA para saber cuándo reservar cita‘.

¿Qué diferencias habrá con GPT-4?

Del punto anterior ya se vislumbran diferencias respecto al modelo más actual en el mercado, GPT-4 en su modalidad Turbo: mejoras en precisión y fiabilidad, más funciones como el intercambio oral ‘Speech in, speech out‘ o el trabajo con vídeo y mayor comprensión y procesamiento. En palabras de Altman ‘Estaremos en una curva de mejora pronunciada durante los próximos 5 o 10 años; esto es lo más estúpido que serán estos modelos‘.

Mejorar la capacidad de comprensión y ganar en fiabilidad implica, entre otras cosas, contar con un mayor volumen de datos y aumentar la potencia para el procesamiento. O lo que es lo mismo, que implica mayores necesidades de cálculo, de hardware y más inversión.

Centrándonos en el apartado técnico, GPT- 3.5 sorprendió por su inteligencia y habilidad para resolver problemas, pero GPT-4 subió de nivel combinando la estructura de nube de Azure con los ordenadores de Microsoft y chips A100 de NVIDIA para lograr un rendimiento a nivel humano. Bajo estas líneas los resultados de ambas tecnologías frente a un mismo examen:



Resultados de los exámenes para humanos de GPT-4 y GPT-3.5. Resultados de los exámenes para humanos de GPT-4 y GPT-3.5.

¿Y GPT-5? Desconocemos si OpenAI tomará la arquitectura de GPT-4 o apostará por algo nuevo, pero todo apunta a que será más inteligente que los humanos.

¿Será GPT-5 de pago? De modelos y planes de precios

Aunque es pronto para conocer los planes oficiales de OpenAI, atendiendo a su estrategia de monetización actual, en la que ahora solo ChatGPT 3.5 es gratis y para usar GPT-4 es necesaria una suscripción a diferentes productos de pago como ChatGPT Plus, ChatGPT Professional o GPT-4 Turbo, o acudir a Microsoft Copilot, que es gratis y tiene bajo el capó la misma inteligencia artificial, cabe esperar que GPT-5 sea de pago.

De hecho, dentro de las características de ChatGPT Plus se incluye la de probar novedades, por lo que lo normal y esperable sería que cuando GPT-5 esté listo, pase a estar disponible a las versiones de suscripción. Quizás eso signifique que GPT-4 pase a ser el modelo estándar gratis de OpenAI, dejando como obsoleto GPT-3.5.

Portada | Foto de Mariia Shalabaieva en Unsplash

