Experimenta la próxima generación de eficiencia y escala con Qwen3-Next — el LLM de código abierto de Alibaba con 80B parámetros, 3B activos por inferencia y una ventana de contexto récord de 262K. Más rápido, más inteligente y preparado para tareas reales complejas.

Qwen3-Next es un modelo de lenguaje revolucionario de 80B parámetros de Alibaba que activa solo 3B por inferencia, logrando enormes ganancias de eficiencia sin sacrificar el rendimiento. Con licencia Apache 2.0, está disponible libremente para investigación y despliegue empresarial.
Qwen3-Next reduce los costos de cómputo al activar solo ~3B de sus 80B parámetros por predicción de token — alcanzando un rendimiento comparable a modelos densos mucho mayores a una fracción del costo.
Publicado bajo Apache 2.0, Qwen3-Next está disponible tanto para investigadores como para negocios, con variantes ajustadas para instrucciones, razonamiento y tareas de propósito general.

Qwen3-Next está diseñado para la máxima eficiencia y escalabilidad, combinando innovaciones arquitectónicas de vanguardia con funciones prácticas que redefinen lo que puede hacer un LLM de código abierto. Desde activación dispersa hasta contexto ultra largo, habilita una IA más rápida, inteligente y asequible a escala.

Una mezcla 3:1 de DeltaNet de tiempo lineal y atención con compuertas permite a Qwen3-Next manejar secuencias de hasta 262K tokens de forma nativa, equilibrando eficiencia y precisión para documentos extensos y grandes conjuntos de datos.
Con 512 expertos pero solo 10+1 activos por token, Qwen3-Next activa apenas el 3,7% de sus parámetros, reduciendo los costos de entrenamiento en un 90% mientras rinde como modelos densos mucho más grandes.
Al predecir múltiples tokens por paso, Qwen3-Next acelera el decodificado y reduce la latencia, brindando experiencias más fluidas en chat, generación de código y escritura de formato largo.
Con llamadas a herramientas y capacidades de razonamiento, Qwen3-Next se integra fácilmente con API y flujos de trabajo, convirtiéndose en la columna vertebral de agentes de IA de nueva generación y aplicaciones empresariales.
Con su ventana de contexto sin precedentes, sólidas capacidades multilingües y de razonamiento, y disponibilidad abierta, ofrece a investigadores y desarrolladores una nueva herramienta poderosa. Ya sea que construyas una IA para filtrar documentos masivos, un asistente de código, o que explores los límites de los modelos de lenguaje, Qwen3-Next es una plataforma emocionante para experimentar. Como ya muestran los benchmarks y las experiencias de usuarios, compite de verdad con los mejores modelos del mundo, siendo mucho más accesible en costo y apertura. Este “gigante eficiente” podría marcar la tendencia de la próxima ola de innovación en LLM: no solo más grande, sino mejor, más rápido y más inteligente.

Qwen3-Next es de código abierto bajo Apache 2.0, habilitando despliegues on‑prem/VPC/nube privada con tu pila de datos e IAM existentes. Reduce el bloqueo con proveedores, cumple con la gobernanza e integra auditorías/permisos para cargas empresariales conformes.

Qwen3-Next es de código abierto bajo Apache 2.0, habilitando despliegues on‑prem/VPC/nube privada con tu pila de datos e IAM existentes. Úsalo para reducir la dependencia de proveedores, cumplir con requisitos de gobernanza e integrar auditoría/permisos para cargas conformes.

Qwen3-Next incluye llamada a funciones nativa y orquestación de herramientas para API, bases de datos, calculadoras y ejecutores de código. Construye agentes de múltiples pasos — retrieve → reason → compute → write → review → report — y combínalo con la variante Qwen3-Next-80B-A3B-Thinking para un razonamiento estructurado paso a paso.

Procesa textos de longitud de libro, paquetes de contratos y transcripciones de varias horas en una sola pasada. La ventana de contexto de 262K de Qwen3-Next y su MoE de alta dispersión permiten resúmenes, comparaciones y preguntas‑respuestas profundas sin un frágil troceado, manteniendo las referencias cruzadas y la coherencia global.