Gemma 4 26B A4B
26 000 millones de parámetros, 4 000 millones activos - inteligencia de vanguardia a velocidad de inferencia
Gemma 4 26B A4B es un modelo Mezcla de Expertos que activa solo 4B parámetros por token ofreciendo calidad cercana a 31B. Con contexto de 256K, más de 140 idiomas y un 88,3 % en AIME 2026, es la vía más eficiente hacia el razonamiento de vanguardia.
Variantes del modelo
Modelos ajustados por instrucciones y modelos base
Elegid entre la variante ajustada por instrucciones, optimizada para chat y finalización de tareas, o el modelo base para ajuste fino y aplicaciones especializadas.
Arquitectura Mezcla de Expertos
25.2B parámetros totales, 3.8B activos por token
Gemma 4 26B A4B utiliza un diseño MoE disperso con 8 expertos activos de un total de 128, más 1 experto compartido. Los 26B parámetros se cargan en memoria para un enrutamiento rápido, pero el coste de inferencia se mantiene cercano al de un modelo denso de 4B.
Ideal para despliegues en producción de alto rendimiento donde necesitáis calidad cercana a 31B a una fracción del coste computacional.
Ajustado por instrucciones
26B Instruct
Optimizado para IA conversacional y finalización de tareas complejas
Ajustado con RLHF para seguir instrucciones y diálogos de múltiples turnos
Preentrenado
26B Base
Modelo base MoE para ajuste fino y aplicaciones especializadas
Preentrenado con datos multimodales diversos y enrutamiento de expertos disperso
Capacidades
Rendimiento de vanguardia a coste de inferencia de 4B
Gemma 4 26B A4B combina la eficiencia MoE con razonamiento avanzado, programación excepcional y comprensión multimodal, ofreciendo calidad cercana a 31B a una fracción del coste computacional.
Eficiencia MoE
Activa solo 3.8B parámetros por token de un total de 25.2B. Calidad cercana a 31B a un coste de inferencia de ~4B: la mejor relación de eficiencia de la familia Gemma 4.
Razonamiento avanzado
El modo de pensamiento configurable permite un razonamiento paso a paso. Alcanza un 88,3 % en matemáticas AIME 2026, a solo 0,9 puntos del modelo denso de 31B.
Programación excepcional
77,1 % en LiveCodeBench v6 y 1718 de ELO en Codeforces. Llamada a funciones nativa para flujos de trabajo agénticos y ejecución autónoma de código.
Ventana de contexto de 256K
Contexto ampliado para bases de código completas, documentos extensos y conversaciones de múltiples turnos. Atención híbrida local/global para eficiencia de memoria.
Comprensión multimodal
Procesa texto e imágenes con relaciones de aspecto variables. 73,8 % en MMMU Pro y 82,4 % en MATH-Vision para razonamiento visual.
Más de 140 idiomas
Compatibilidad multilingüe con comprensión del contexto cultural. 82,6 % en MMLU Pro en diversos dominios de conocimiento.
Aspectos destacados
Métricas de rendimiento excepcionales
Gemma 4 26B A4B alcanza resultados cercanos a 31B en diversos benchmarks activando solo 3.8B parámetros por token.
Logros principales
- Arena AI ELO 1441 - competitivo con el modelo denso de 31B
- 88,3 % en matemáticas AIME 2026 (sin herramientas)
- 77,1 % en programación LiveCodeBench v6
- 82,3 % en conocimiento científico GPQA Diamond
- 85,5 % en uso de herramientas agénticas t2-bench
Especificaciones técnicas
- 25.2B parámetros totales, 3.8B activos por token
- 8 expertos activos + 1 compartido de un total de 128
- Ventana de contexto de 256K tokens
- Compatibilidad con más de 140 idiomas
- Mecanismo de atención híbrido local/global
Rendimiento
Calidad cercana a 31B a coste de inferencia de 4B
Gemma 4 26B A4B alcanza un 88,3 % en AIME 2026 y un 82,6 % en MMLU Pro - a menos del 1 % del modelo denso de 31B - activando solo 3.8B parámetros por token.
Gemma 4 26B A4B demuestra una excelencia constante en benchmarks de razonamiento, programación, multimodalidad y capacidades agénticas, a entre un 1 y un 3 % del modelo denso de 31B en cada tarea.
Arena AI ELO 1441 - competitivo con el modelo denso de 31B
88,3 % en matemáticas AIME 2026 (sin herramientas)
77,1 % en programación competitiva LiveCodeBench v6
82,3 % en conocimiento científico GPQA Diamond
85,5 % en uso de herramientas agénticas t2-bench
Comparativa de benchmarks
26B MoE frente a 31B denso y la familia Gemma 4
Gemma 4 26B A4B ofrece un rendimiento cercano a 31B en tareas de razonamiento, programación, multimodalidad y capacidades agénticas a una fracción del coste de inferencia.
| Benchmark | Gemma 4 26B A4B IT Thinking Destacado | Gemma 4 31B IT Thinking | Gemma 4 E4B IT Thinking | Gemma 3 27B IT |
|---|---|---|---|---|
Arena AI (text) A fecha de 2 de abril de 2026 | 1441 | 1452 | - | 1365 |
MMLU Pro Conocimiento y razonamiento Sin herramientas | 82.6% | 85.2% | 69.4% | 67.6% |
MMMU Pro Razonamiento multimodal | 73.8% | 76.9% | 52.6% | 49.7% |
AIME 2026 Matemáticas Sin herramientas | 88.3% | 89.2% | 42.5% | 20.8% |
LiveCodeBench v6 Programación competitiva | 77.1% | 80.0% | 52.0% | 29.1% |
GPQA Diamond Conocimiento científico Sin herramientas | 82.3% | 84.3% | 58.6% | 42.4% |
t2-bench Uso de herramientas agénticas Retail | 85.5% | 86.4% | 57.5% | 6.6% |
Resultados de benchmarks de la ficha oficial del modelo Gemma 4. Puntuaciones de Arena AI a fecha de 2 de abril de 2026.
Arquitectura MoE
Capacidad de 26B, coste de inferencia de 4B
El diseño Mezcla de Expertos enruta cada token a través de 8 de 128 expertos más 1 experto compartido. Los 26B parámetros permanecen en memoria para un enrutamiento instantáneo, pero solo 3.8B se activan por pasada, ofreciendo calidad cercana a 31B a una fracción del coste computacional.
- 3.8B parámetros activos por token de una capacidad total de 25.2B
- 8 expertos activos + 1 compartido de un total de 128 expertos
- RoPE proporcional (p-RoPE) para un manejo eficiente del contexto de 256K
Razonamiento avanzado
88,3 % en AIME 2026 - a menos del 1 % del modelo de 31B
El modo de pensamiento configurable permite un razonamiento transparente paso a paso para matemáticas, lógica y resolución de problemas en múltiples pasos. El MoE de 26B reduce la diferencia con el modelo denso de 31B a menos de 1 punto porcentual en los benchmarks de matemáticas más exigentes.
- 88,3 % en matemáticas AIME 2026 (sin herramientas)
- 82,3 % en ciencia de nivel avanzado GPQA Diamond
- Modo de razonamiento integrado con explicaciones paso a paso
Excelencia en programación
77,1 % en LiveCodeBench v6 con llamada a funciones nativa
Con un 77,1 % en LiveCodeBench v6 y 1718 de ELO en Codeforces, Gemma 4 26B A4B destaca en generación de código, depuración y flujos de trabajo agénticos. La llamada a funciones nativa permite agentes autónomos sin necesidad de ajuste fino.
- 77,1 % en problemas de programación competitiva LiveCodeBench v6
- 1718 de puntuación ELO en Codeforces
- Llamada a funciones nativa para agentes autónomos
Comprensión multimodal
Procesamiento de texto e imágenes con resolución variable
Procesa texto e imágenes de forma conjunta con soporte para relaciones de aspecto y resoluciones variables. 73,8 % en MMMU Pro y 82,4 % en MATH-Vision demuestran un sólido razonamiento visual y comprensión de documentos.
- 73,8 % en razonamiento multimodal MMMU Pro
- 82,4 % en problemas de matemáticas visuales MATH-Vision
- Soporte de resolución de imagen variable (70-1120 tokens)
Primeros pasos
Probad Gemma 4 26B ahora
Empezad a chatear al instante o descargad los pesos para un despliegue autoalojado.
Descargar pesos
Despliegue autoalojado
Descargad los pesos oficiales del modelo para desplegarlo en vuestra infraestructura.
Desplegar y escalar
Opciones de despliegue en producción
Despliegue preparado para empresas en Google Cloud, Kubernetes o vuestra propia infraestructura.
Uníos al Gemmaverse
Parte del ecosistema Gemma
Gemma 4 26B A4B forma parte de la familia de modelos abiertos de Google, con amplio soporte de la comunidad, integraciones y recursos.
Primeros pasos
¿Preparados para construir con Gemma 4 26B A4B?
Empezad a chatear gratis al instante o descargad el modelo para un despliegue autoalojado en vuestra infraestructura.