La compañía tecnológica Alibaba ha dado a conocer Qwen3, una familia de modelos de inteligencia artificial que promete plantar cara a los mejores sistemas de Google y OpenAI. Estos modelos, disponibles bajo una licencia abierta en plataformas como Hugging Face y GitHub, abarcan desde pequeños sistemas de 0,6 mil millones de parámetros hasta gigantes de 235 mil millones de parámetros.
Para ponerlo en contexto, los parámetros de un modelo podríamos compararlos con el número de piezas de un rompecabezas: cuanto más grande y complejo, mayor detalle y sofisticación en la imagen final.
¿Qué hace especial a Qwen3?
Alibaba ha diseñado Qwen3 como un modelo «híbrido» capaz de alternar entre dos modos de funcionamiento: uno que toma su tiempo para razonar sobre problemas complejos, y otro que responde rápidamente a solicitudes sencillas. Es como tener un coche eléctrico que puede cambiar entre modo eco para trayectos largos y modo sport para aceleraciones rápidas.
Esta flexibilidad permite a los usuarios definir el «presupuesto de pensamiento» que quieren utilizar, algo que resulta útil según la tarea que se necesite resolver.
=> Recibir por Whatsapp las noticias destacadas
Una arquitectura eficiente y multilingüe
Algunos de los modelos Qwen3 incorporan la arquitectura MoE (Mixture of Experts), una técnica que divide las tareas en subtareas y las asigna a pequeños modelos especializados. Esto equivale a tener un equipo de especialistas, donde cada uno resuelve exactamente lo que mejor sabe hacer, logrando mayor eficiencia computacional.
Qwen3 no se limita al chino o al inglés: soporta 119 idiomas, lo que lo hace apto para una audiencia verdaderamente global. Su entrenamiento fue realizado sobre un colosal conjunto de datos de casi 36 billones de tokens, que incluyen desde libros de texto y preguntas-respuestas hasta fragmentos de código y datos generados por IA.
Comparativas con otros modelos de IA
Aunque Qwen3 no supera claramente a los últimos modelos de OpenAI o Google, se sitúa en una posición competitiva. Por ejemplo, el modelo más grande de esta serie, el Qwen-3-235B-A22B, ha superado a modelos como o3-mini de OpenAI y Gemini 2.5 Pro de Google en plataformas de evaluación como Codeforces y pruebas de matemáticas avanzadas como AIME.
Es importante mencionar que este modelo aún no está disponible para el público. En cambio, el más grande disponible, el Qwen3-32B, sigue mostrando un rendimiento competitivo, superando en algunas pruebas al modelo o1 de OpenAI, especialmente en tareas de programación como LiveCodeBench.
Aplicaciones prácticas y disponibilidad
Los modelos Qwen3 destacan no solo en procesamiento de lenguaje, sino también en tareas específicas como llamadas de herramientas, seguimiento de instrucciones detalladas y replicación de formatos de datos. Esto los hace especialmente útiles en entornos de negocio donde la precisión y la eficiencia son críticas.
Ya es posible acceder a Qwen3 no solo mediante descarga directa, sino también a través de proveedores cloud como Fireworks AI y Hyperbolic.
El contexto geopolítico de la IA
El ascenso de modelos de IA de origen chino como Qwen3 está generando tensiones, impulsando a Estados Unidos a restringir el acceso de las compañías chinas a chips avanzados para entrenamiento de modelos. Sin embargo, la disponibilidad abierta de Qwen3 refleja una tendencia imparable: la IA de vanguardia está dejando de ser exclusiva de laboratorios cerrados para llegar a un ecosistema más amplio y diverso.
Tuhin Srivastava, CEO de la empresa de hospedaje cloud Baseten, señala que Qwen3 es otro ejemplo de cómo los modelos abiertos están alcanzando a los sistemas cerrados, ofreciendo a las empresas más opciones entre construir sus propias soluciones o adquirir servicios ya empaquetados.
¿Qué significa Qwen3 para el futuro?
Para usuarios, desarrolladores y empresas, el lanzamiento de Qwen3 representa una ampliación del abanico de herramientas accesibles. Como elegir entre cocinar en casa o pedir comida a domicilio, las organizaciones podrán optar por entrenar sus propios modelos basados en Qwen3 o aprovechar directamente los servicios ofrecidos.
En definitiva, Qwen3 introduce una nueva dinámica en el panorama de la inteligencia artificial, aumentando la competencia, promoviendo la innovación y democratizando el acceso a tecnologías de punta.
Fuente: Link