Gemma 4 26B A4B
26 bilhões de parâmetros, 4 bilhões ativos - inteligência de fronteira na velocidade de inferência
Gemma 4 26B A4B é um modelo Mixture-of-Experts que ativa apenas 4B parâmetros por token enquanto entrega qualidade próxima ao 31B. Com contexto de 256K, mais de 140 idiomas e 88,3% no AIME 2026, é o caminho mais eficiente para raciocínio de classe de fronteira.
Variantes do modelo
Modelos ajustados por instrução e base
Escolha entre a variante ajustada por instrução, otimizada para chat e conclusão de tarefas, ou o modelo base para ajuste fino e aplicações especializadas.
Arquitetura Mixture-of-Experts
25,2B parâmetros totais, 3,8B ativos por token
Gemma 4 26B A4B usa um design MoE esparso com 8 especialistas ativos de 128 no total, mais 1 especialista compartilhado. Todos os 26B parâmetros são carregados na memória para roteamento rápido, mas o custo de inferência permanece próximo ao de um modelo denso de 4B.
Ideal para implantações em produção de alto throughput onde você precisa de qualidade próxima ao 31B por uma fração do custo computacional.
Ajustado por instrução
26B Instruct
Otimizado para IA conversacional e conclusão de tarefas complexas
Ajustado com RLHF para seguir instruções e diálogos de múltiplos turnos
Pré-treinado
26B Base
Modelo MoE base para ajuste fino e aplicações especializadas
Pré-treinado em dados multimodais diversos com roteamento esparso de especialistas
Capacidades
Desempenho de nível de fronteira com custo de inferência de 4B
Gemma 4 26B A4B combina eficiência MoE com raciocínio avançado, codificação excepcional e compreensão multimodal - entregando qualidade próxima ao 31B por uma fração do custo computacional.
Eficiência MoE
Ativa apenas 3,8B parâmetros por token de um pool de 25,2B. Qualidade próxima ao 31B com custo de inferência de ~4B - a melhor relação de eficiência da família Gemma 4.
Raciocínio avançado
Modo de pensamento configurável permite raciocínio passo a passo. Alcança 88,3% no AIME 2026 em matemática - apenas 0,9 pontos atrás do modelo denso de 31B.
Codificação excepcional
77,1% no LiveCodeBench v6 e 1718 ELO no Codeforces. Chamada de função nativa para fluxos de trabalho agênticos e execução autônoma de código.
Janela de contexto de 256K
Contexto estendido para bases de código inteiras, documentos longos e conversas de múltiplos turnos. Atenção híbrida local/global para eficiência de memória.
Compreensão multimodal
Processa texto e imagens com proporções variáveis. 73,8% no MMMU Pro e 82,4% no MATH-Vision para raciocínio visual.
Mais de 140 idiomas
Suporte multilíngue com compreensão de contexto cultural. 82,6% no MMLU Pro em diversos domínios de conhecimento.
Destaques principais
Métricas de desempenho excepcionais
Gemma 4 26B A4B alcança resultados próximos ao 31B em diversos benchmarks enquanto ativa apenas 3,8B parâmetros por token.
Principais conquistas
- Arena AI ELO 1441 - competitivo com o modelo denso de 31B
- 88,3% no AIME 2026 em matemática (sem ferramentas)
- 77,1% no LiveCodeBench v6 em codificação
- 82,3% no GPQA Diamond em conhecimento científico
- 85,5% no t2-bench em uso agêntico de ferramentas
Especificações técnicas
- 25,2B parâmetros totais, 3,8B ativos por token
- 8 especialistas ativos + 1 compartilhado de 128 no total
- Janela de contexto de 256K tokens
- Suporte para mais de 140 idiomas
- Mecanismo de atenção híbrida local/global
Desempenho
Qualidade próxima ao 31B com custo de inferência de 4B
Gemma 4 26B A4B alcança 88,3% no AIME 2026 e 82,6% no MMLU Pro - dentro de 1% do modelo denso de 31B - enquanto ativa apenas 3,8B parâmetros por token.
Gemma 4 26B A4B demonstra excelência consistente em benchmarks de raciocínio, codificação, multimodal e agênticos - dentro de 1-3% do modelo denso de 31B em todas as tarefas.
Arena AI ELO 1441 - competitivo com o modelo denso de 31B
88,3% no AIME 2026 em matemática (sem ferramentas)
77,1% no LiveCodeBench v6 em codificação competitiva
82,3% no GPQA Diamond em conhecimento científico
85,5% no t2-bench em uso agêntico de ferramentas
Comparação de benchmarks
26B MoE vs 31B Denso e a família Gemma 4
Gemma 4 26B A4B entrega desempenho próximo ao 31B em tarefas de raciocínio, codificação, multimodal e agênticas por uma fração do custo de inferência.
| Benchmark | Gemma 4 26B A4B IT Thinking Destaque | Gemma 4 31B IT Thinking | Gemma 4 E4B IT Thinking | Gemma 3 27B IT |
|---|---|---|---|---|
Arena AI (text) Em 2 de abril de 2026 | 1441 | 1452 | - | 1365 |
MMLU Pro Conhecimento e raciocínio Sem ferramentas | 82.6% | 85.2% | 69.4% | 67.6% |
MMMU Pro Raciocínio multimodal | 73.8% | 76.9% | 52.6% | 49.7% |
AIME 2026 Matemática Sem ferramentas | 88.3% | 89.2% | 42.5% | 20.8% |
LiveCodeBench v6 Codificação competitiva | 77.1% | 80.0% | 52.0% | 29.1% |
GPQA Diamond Conhecimento científico Sem ferramentas | 82.3% | 84.3% | 58.6% | 42.4% |
t2-bench Uso agêntico de ferramentas Retail | 85.5% | 86.4% | 57.5% | 6.6% |
Resultados de benchmark da ficha oficial do modelo Gemma 4. Pontuações do Arena AI em 2 de abril de 2026.
Arquitetura MoE
Capacidade de 26B, custo de inferência de 4B
O design Mixture-of-Experts roteia cada token por 8 de 128 especialistas mais 1 especialista compartilhado. Todos os 26B parâmetros permanecem na memória para roteamento instantâneo, mas apenas 3,8B são ativados por passagem - entregando qualidade próxima ao 31B por uma fração do custo computacional.
- 3,8B parâmetros ativos por token de uma capacidade total de 25,2B
- 8 especialistas ativos + 1 compartilhado de 128 especialistas no total
- RoPE Proporcional (p-RoPE) para tratamento eficiente de contexto de 256K
Raciocínio Avançado
88,3% no AIME 2026 - dentro de 1% do modelo de 31B
O modo de pensamento configurável permite raciocínio transparente passo a passo para matemática, lógica e resolução de problemas em múltiplas etapas. O MoE de 26B fecha a diferença com o modelo denso de 31B para menos de 1 ponto percentual nos benchmarks de matemática mais difíceis.
- 88,3% no AIME 2026 em matemática (sem ferramentas)
- 82,3% no GPQA Diamond em ciência de nível pós-graduação
- Modo de raciocínio integrado com explicações passo a passo
Excelência em Codificação
77,1% no LiveCodeBench v6 com chamada de função nativa
Com 77,1% no LiveCodeBench v6 e 1718 ELO no Codeforces, o Gemma 4 26B A4B se destaca em geração de código, depuração e fluxos de trabalho agênticos. A chamada de função nativa permite agentes autônomos sem ajuste fino.
- 77,1% no LiveCodeBench v6 em problemas de codificação competitiva
- 1718 ELO no Codeforces
- Chamada de função nativa para agentes autônomos
Compreensão Multimodal
Processamento de texto e imagem com resolução variável
Processe texto e imagens juntos com suporte para proporções e resoluções variáveis. 73,8% no MMMU Pro e 82,4% no MATH-Vision demonstram forte raciocínio visual e compreensão de documentos.
- 73,8% no MMMU Pro em raciocínio multimodal
- 82,4% no MATH-Vision em problemas de matemática visual
- Suporte a resolução de imagem variável (70-1120 tokens)
Começar
Experimente o Gemma 4 26B agora
Comece a conversar instantaneamente ou baixe os pesos para implantação auto-hospedada.
Baixar pesos
Implantação auto-hospedada
Baixe os pesos oficiais do modelo para implantação na sua infraestrutura.
Implantar e escalar
Opções de implantação em produção
Implantação pronta para empresas no Google Cloud, Kubernetes ou na sua própria infraestrutura.
Junte-se ao Gemmaverse
Parte do ecossistema Gemma mais amplo
Gemma 4 26B A4B faz parte da família de modelos abertos do Google, com amplo suporte da comunidade, integrações e recursos.
Começar
Pronto para construir com o Gemma 4 26B A4B?
Comece a conversar instantaneamente de graça ou baixe o modelo para implantação auto-hospedada na sua infraestrutura.