Gemma 4 26B A4B

26 mil milhões de parâmetros, 4 mil milhões ativos - inteligência de fronteira à velocidade de inferência

Gemma 4 26B A4B é um modelo Mixture-of-Experts que ativa apenas 4B parâmetros por token enquanto oferece qualidade próxima do 31B. Com contexto de 256K, mais de 140 idiomas e 88,3% no AIME 2026, é o caminho mais eficiente para raciocínio de classe fronteiriça.

Variantes do modelo

Modelos ajustados por instrução e base

Escolha entre a variante ajustada por instrução, otimizada para chat e conclusão de tarefas, ou o modelo base para ajuste fino e aplicações especializadas.

Arquitetura Mixture-of-Experts

25,2B parâmetros totais, 3,8B ativos por token

Gemma 4 26B A4B utiliza um design MoE esparso com 8 especialistas ativos de 128 no total, mais 1 especialista partilhado. Todos os 26B parâmetros são carregados na memória para encaminhamento rápido, mas o custo de inferência mantém-se próximo do de um modelo denso de 4B.

Ideal para implementações em produção de alto débito onde é necessária qualidade próxima do 31B por uma fração do custo computacional.

Ajustado por instrução

26B Instruct

Otimizado para IA conversacional e conclusão de tarefas complexas

Ajustado com RLHF para seguir instruções e diálogos de múltiplos turnos

Disponível agora

Pré-treinado

26B Base

Modelo MoE base para ajuste fino e aplicações especializadas

Pré-treinado em dados multimodais diversos com encaminhamento esparso de especialistas

Disponível agora

Capacidades

Desempenho de nível fronteiriço com custo de inferência de 4B

Gemma 4 26B A4B combina eficiência MoE com raciocínio avançado, codificação excecional e compreensão multimodal - oferecendo qualidade próxima do 31B por uma fração do custo computacional.

Eficiência MoE

Ativa apenas 3,8B parâmetros por token de um conjunto de 25,2B. Qualidade próxima do 31B com custo de inferência de ~4B - a melhor relação de eficiência da família Gemma 4.

Raciocínio avançado

Modo de pensamento configurável permite raciocínio passo a passo. Alcança 88,3% no AIME 2026 em matemática - apenas 0,9 pontos atrás do modelo denso de 31B.

Codificação excecional

77,1% no LiveCodeBench v6 e 1718 ELO no Codeforces. Chamada de funções nativa para fluxos de trabalho agênticos e execução autónoma de código.

Janela de contexto de 256K

Contexto alargado para bases de código inteiras, documentos longos e conversas de múltiplos turnos. Atenção híbrida local/global para eficiência de memória.

Compreensão multimodal

Processa texto e imagens com proporções variáveis. 73,8% no MMMU Pro e 82,4% no MATH-Vision para raciocínio visual.

Mais de 140 idiomas

Suporte multilingue com compreensão de contexto cultural. 82,6% no MMLU Pro em diversos domínios de conhecimento.

Destaques principais

Métricas de desempenho excecionais

Gemma 4 26B A4B alcança resultados próximos do 31B em diversos benchmarks enquanto ativa apenas 3,8B parâmetros por token.

Principais conquistas

  • Arena AI ELO 1441 - competitivo com o modelo denso de 31B
  • 88,3% no AIME 2026 em matemática (sem ferramentas)
  • 77,1% no LiveCodeBench v6 em codificação
  • 82,3% no GPQA Diamond em conhecimento científico
  • 85,5% no t2-bench em utilização agêntica de ferramentas

Especificações técnicas

  • 25,2B parâmetros totais, 3,8B ativos por token
  • 8 especialistas ativos + 1 partilhado de 128 no total
  • Janela de contexto de 256K tokens
  • Suporte para mais de 140 idiomas
  • Mecanismo de atenção híbrida local/global

Desempenho

Qualidade próxima do 31B com custo de inferência de 4B

Gemma 4 26B A4B alcança 88,3% no AIME 2026 e 82,6% no MMLU Pro - dentro de 1% do modelo denso de 31B - enquanto ativa apenas 3,8B parâmetros por token.

Gemma 4 26B A4B demonstra excelência consistente em benchmarks de raciocínio, codificação, multimodal e agênticos - dentro de 1-3% do modelo denso de 31B em todas as tarefas.

Gráfico de comparação de desempenho do Gemma 4 26B A4B

Arena AI ELO 1441 - competitivo com o modelo denso de 31B

88,3% no AIME 2026 em matemática (sem ferramentas)

77,1% no LiveCodeBench v6 em codificação competitiva

82,3% no GPQA Diamond em conhecimento científico

85,5% no t2-bench em utilização agêntica de ferramentas

Comparação de benchmarks

26B MoE vs 31B Denso e a família Gemma 4

Gemma 4 26B A4B oferece desempenho próximo do 31B em tarefas de raciocínio, codificação, multimodal e agênticas por uma fração do custo de inferência.

Benchmark
Gemma 4 26B A4B IT
Thinking
Destaque
Gemma 4 31B IT
Thinking
Gemma 4 E4B IT
Thinking
Gemma 3 27B IT
Arena AI (text)
Em 2 de abril de 2026
14411452-1365
MMLU Pro
Conhecimento e raciocínio
Sem ferramentas
82.6%85.2%69.4%67.6%
MMMU Pro
Raciocínio multimodal
73.8%76.9%52.6%49.7%
AIME 2026
Matemática
Sem ferramentas
88.3%89.2%42.5%20.8%
LiveCodeBench v6
Codificação competitiva
77.1%80.0%52.0%29.1%
GPQA Diamond
Conhecimento científico
Sem ferramentas
82.3%84.3%58.6%42.4%
t2-bench
Utilização agêntica de ferramentas
Retail
85.5%86.4%57.5%6.6%

Resultados de benchmark da ficha oficial do modelo Gemma 4. Pontuações do Arena AI em 2 de abril de 2026.

Arquitetura MoE

Capacidade de 26B, custo de inferência de 4B

O design Mixture-of-Experts encaminha cada token por 8 de 128 especialistas mais 1 especialista partilhado. Todos os 26B parâmetros permanecem na memória para encaminhamento instantâneo, mas apenas 3,8B são ativados por passagem - oferecendo qualidade próxima do 31B por uma fração do custo computacional.

  • 3,8B parâmetros ativos por token de uma capacidade total de 25,2B
  • 8 especialistas ativos + 1 partilhado de 128 especialistas no total
  • RoPE Proporcional (p-RoPE) para tratamento eficiente de contexto de 256K
Gemma 4 26B A4B MoE architecture

Raciocínio Avançado

88,3% no AIME 2026 - dentro de 1% do modelo de 31B

O modo de pensamento configurável permite raciocínio transparente passo a passo para matemática, lógica e resolução de problemas em múltiplas etapas. O MoE de 26B fecha a diferença com o modelo denso de 31B para menos de 1 ponto percentual nos benchmarks de matemática mais difíceis.

  • 88,3% no AIME 2026 em matemática (sem ferramentas)
  • 82,3% no GPQA Diamond em ciência de nível pós-graduado
  • Modo de raciocínio integrado com explicações passo a passo
Gemma 4 26B A4B advanced reasoning

Excelência em Codificação

77,1% no LiveCodeBench v6 com chamada de funções nativa

Com 77,1% no LiveCodeBench v6 e 1718 ELO no Codeforces, o Gemma 4 26B A4B destaca-se em geração de código, depuração e fluxos de trabalho agênticos. A chamada de funções nativa permite agentes autónomos sem ajuste fino.

  • 77,1% no LiveCodeBench v6 em problemas de codificação competitiva
  • 1718 ELO no Codeforces
  • Chamada de funções nativa para agentes autónomos
Gemma 4 26B A4B coding excellence

Compreensão Multimodal

Processamento de texto e imagem com resolução variável

Processe texto e imagens em conjunto com suporte para proporções e resoluções variáveis. 73,8% no MMMU Pro e 82,4% no MATH-Vision demonstram forte raciocínio visual e compreensão de documentos.

  • 73,8% no MMMU Pro em raciocínio multimodal
  • 82,4% no MATH-Vision em problemas de matemática visual
  • Suporte a resolução de imagem variável (70-1120 tokens)
Gemma 4 26B A4B multimodal understanding

Descarregar pesos

Implementação auto-hospedada

Descarregue os pesos oficiais do modelo para implementação na sua infraestrutura.

Implementar e escalar

Opções de implementação em produção

Implementação pronta para empresas no Google Cloud, Kubernetes ou na sua própria infraestrutura.

Junte-se ao Gemmaverse

Parte do ecossistema Gemma mais alargado

Gemma 4 26B A4B faz parte da família de modelos abertos da Google, com amplo suporte da comunidade, integrações e recursos.

Documentação

Guias completos para integração e implementação

Ler documentação

Segurança e Responsabilidade

Desenvolvimento ético de IA e diretrizes de segurança

Saber mais

Ficha do Modelo

Especificações técnicas e resultados de avaliação

Ver detalhes

Repositório GitHub

Código-fonte, exemplos e contribuições da comunidade

Ver código

HuggingFace

Descarregue pesos e explore o hub de modelos

Descarregar

Implementação na Nuvem

Implementação empresarial no Google Cloud

Implementar

Começar

Pronto para construir com o Gemma 4 26B A4B?

Comece a conversar instantaneamente de forma gratuita ou descarregue o modelo para implementação auto-hospedada na sua infraestrutura.