Gemma 4 26B A4B

26 mil millones de parámetros, 4 mil millones activos - inteligencia de frontera a velocidad de inferencia

Gemma 4 26B A4B es un modelo Mezcla de Expertos que activa solo 4B parámetros por token ofreciendo calidad cercana a 31B. Con contexto de 256K, más de 140 idiomas y un 88.3% en AIME 2026, es la vía más eficiente hacia el razonamiento de frontera.

Variantes del modelo

Modelos ajustados por instrucciones y modelos base

Elige entre la variante ajustada por instrucciones, optimizada para chat y completar tareas, o el modelo base para ajuste fino y aplicaciones especializadas.

Arquitectura Mezcla de Expertos

25.2B parámetros totales, 3.8B activos por token

Gemma 4 26B A4B usa un diseño MoE disperso con 8 expertos activos de un total de 128, más 1 experto compartido. Los 26B parámetros se cargan en memoria para un enrutamiento rápido, pero el costo de inferencia se mantiene cercano al de un modelo denso de 4B.

Ideal para implementaciones en producción de alto rendimiento donde necesitas calidad cercana a 31B a una fracción del costo computacional.

Ajustado por instrucciones

26B Instruct

Optimizado para IA conversacional y tareas complejas

Ajustado con RLHF para seguir instrucciones y diálogos de múltiples turnos

Disponible ahora

Preentrenado

26B Base

Modelo base MoE para ajuste fino y aplicaciones especializadas

Preentrenado con datos multimodales diversos y enrutamiento de expertos disperso

Disponible ahora

Capacidades

Rendimiento de frontera a costo de inferencia de 4B

Gemma 4 26B A4B combina la eficiencia MoE con razonamiento avanzado, programación excepcional y comprensión multimodal, ofreciendo calidad cercana a 31B a una fracción del costo computacional.

Eficiencia MoE

Activa solo 3.8B parámetros por token de un total de 25.2B. Calidad cercana a 31B a un costo de inferencia de ~4B: la mejor relación de eficiencia de la familia Gemma 4.

Razonamiento avanzado

El modo de pensamiento configurable permite razonar paso a paso. Alcanza un 88.3% en matemáticas AIME 2026, a solo 0.9 puntos del modelo denso de 31B.

Programación excepcional

77.1% en LiveCodeBench v6 y 1718 de ELO en Codeforces. Llamada a funciones nativa para flujos de trabajo agénticos y ejecución autónoma de código.

Ventana de contexto de 256K

Contexto extendido para bases de código completas, documentos largos y conversaciones de múltiples turnos. Atención híbrida local/global para eficiencia de memoria.

Comprensión multimodal

Procesa texto e imágenes con relaciones de aspecto variables. 73.8% en MMMU Pro y 82.4% en MATH-Vision para razonamiento visual.

Más de 140 idiomas

Soporte multilingüe con comprensión del contexto cultural. 82.6% en MMLU Pro en diversos dominios de conocimiento.

Puntos clave

Métricas de rendimiento excepcionales

Gemma 4 26B A4B alcanza resultados cercanos a 31B en diversos benchmarks activando solo 3.8B parámetros por token.

Logros principales

  • Arena AI ELO 1441 - competitivo con el modelo denso de 31B
  • 88.3% en matemáticas AIME 2026 (sin herramientas)
  • 77.1% en programación LiveCodeBench v6
  • 82.3% en conocimiento científico GPQA Diamond
  • 85.5% en uso de herramientas agénticas t2-bench

Especificaciones técnicas

  • 25.2B parámetros totales, 3.8B activos por token
  • 8 expertos activos + 1 compartido de un total de 128
  • Ventana de contexto de 256K tokens
  • Soporte para más de 140 idiomas
  • Mecanismo de atención híbrido local/global

Rendimiento

Calidad cercana a 31B a costo de inferencia de 4B

Gemma 4 26B A4B alcanza un 88.3% en AIME 2026 y un 82.6% en MMLU Pro - a menos del 1% del modelo denso de 31B - activando solo 3.8B parámetros por token.

Gemma 4 26B A4B demuestra excelencia constante en benchmarks de razonamiento, programación, multimodalidad y capacidades agénticas, a entre un 1 y un 3% del modelo denso de 31B en cada tarea.

Gráfica comparativa de rendimiento de Gemma 4 26B A4B

Arena AI ELO 1441 - competitivo con el modelo denso de 31B

88.3% en matemáticas AIME 2026 (sin herramientas)

77.1% en programación competitiva LiveCodeBench v6

82.3% en conocimiento científico GPQA Diamond

85.5% en uso de herramientas agénticas t2-bench

Comparativa de benchmarks

26B MoE vs 31B denso y la familia Gemma 4

Gemma 4 26B A4B ofrece un rendimiento cercano a 31B en tareas de razonamiento, programación, multimodalidad y capacidades agénticas a una fracción del costo de inferencia.

Benchmark
Gemma 4 26B A4B IT
Thinking
Destacado
Gemma 4 31B IT
Thinking
Gemma 4 E4B IT
Thinking
Gemma 3 27B IT
Arena AI (text)
Al 2 de abril de 2026
14411452-1365
MMLU Pro
Conocimiento y razonamiento
Sin herramientas
82.6%85.2%69.4%67.6%
MMMU Pro
Razonamiento multimodal
73.8%76.9%52.6%49.7%
AIME 2026
Matemáticas
Sin herramientas
88.3%89.2%42.5%20.8%
LiveCodeBench v6
Programación competitiva
77.1%80.0%52.0%29.1%
GPQA Diamond
Conocimiento científico
Sin herramientas
82.3%84.3%58.6%42.4%
t2-bench
Uso de herramientas agénticas
Retail
85.5%86.4%57.5%6.6%

Resultados de benchmarks de la ficha oficial del modelo Gemma 4. Puntuaciones de Arena AI al 2 de abril de 2026.

Arquitectura MoE

Capacidad de 26B, costo de inferencia de 4B

El diseño Mezcla de Expertos enruta cada token a través de 8 de 128 expertos más 1 experto compartido. Los 26B parámetros permanecen en memoria para un enrutamiento instantáneo, pero solo 3.8B se activan por pasada, ofreciendo calidad cercana a 31B a una fracción del costo computacional.

  • 3.8B parámetros activos por token de una capacidad total de 25.2B
  • 8 expertos activos + 1 compartido de un total de 128 expertos
  • RoPE proporcional (p-RoPE) para un manejo eficiente del contexto de 256K
Gemma 4 26B A4B MoE architecture

Razonamiento avanzado

88.3% en AIME 2026 - a menos del 1% del modelo de 31B

El modo de pensamiento configurable permite un razonamiento transparente paso a paso para matemáticas, lógica y resolución de problemas en múltiples pasos. El MoE de 26B reduce la diferencia con el modelo denso de 31B a menos de 1 punto porcentual en los benchmarks de matemáticas más exigentes.

  • 88.3% en matemáticas AIME 2026 (sin herramientas)
  • 82.3% en ciencia de nivel avanzado GPQA Diamond
  • Modo de razonamiento integrado con explicaciones paso a paso
Gemma 4 26B A4B advanced reasoning

Excelencia en programación

77.1% en LiveCodeBench v6 con llamada a funciones nativa

Con un 77.1% en LiveCodeBench v6 y 1718 de ELO en Codeforces, Gemma 4 26B A4B sobresale en generación de código, depuración y flujos de trabajo agénticos. La llamada a funciones nativa permite agentes autónomos sin necesidad de ajuste fino.

  • 77.1% en problemas de programación competitiva LiveCodeBench v6
  • 1718 de puntuación ELO en Codeforces
  • Llamada a funciones nativa para agentes autónomos
Gemma 4 26B A4B coding excellence

Comprensión multimodal

Procesamiento de texto e imágenes con resolución variable

Procesa texto e imágenes juntos con soporte para relaciones de aspecto y resoluciones variables. 73.8% en MMMU Pro y 82.4% en MATH-Vision demuestran un sólido razonamiento visual y comprensión de documentos.

  • 73.8% en razonamiento multimodal MMMU Pro
  • 82.4% en problemas de matemáticas visuales MATH-Vision
  • Soporte de resolución de imagen variable (70-1120 tokens)
Gemma 4 26B A4B multimodal understanding

Descargar pesos

Implementación propia

Descarga los pesos oficiales del modelo para implementarlo en tu infraestructura.

Implementar y escalar

Opciones de implementación en producción

Implementación lista para empresas en Google Cloud, Kubernetes o tu propia infraestructura.

Únete al Gemmaverse

Parte del ecosistema Gemma

Gemma 4 26B A4B es parte de la familia de modelos abiertos de Google, con amplio soporte de la comunidad, integraciones y recursos.

Documentación

Guías completas de integración e implementación

Leer documentación

Seguridad y responsabilidad

Desarrollo ético de IA y lineamientos de seguridad

Conocer más

Ficha del modelo

Especificaciones técnicas y resultados de evaluación

Ver detalles

Repositorio en GitHub

Código fuente, ejemplos y contribuciones de la comunidad

Ver código

HuggingFace

Descarga los pesos y explora el hub de modelos

Descargar

Implementación en la nube

Implementación empresarial en Google Cloud

Implementar

Primeros pasos

¿Listo para construir con Gemma 4 26B A4B?

Comienza a chatear gratis al instante o descarga el modelo para implementarlo en tu propia infraestructura.