Gemma 4 26B A4B

26 miliardi di parametri, 4 miliardi attivi - intelligenza di frontiera alla velocità di inferenza

Gemma 4 26B A4B è un modello Mixture-of-Experts che attiva solo 4B parametri per token offrendo qualità vicina al 31B. Con contesto da 256K, oltre 140 lingue e l'88,3% su AIME 2026, è il percorso più efficiente verso un ragionamento di classe frontiera.

Varianti del modello

Modelli instruction-tuned e base

Scegli tra la variante instruction-tuned ottimizzata per la chat e il completamento di attività, oppure il modello base per il fine-tuning e le applicazioni specializzate.

Architettura Mixture-of-Experts

25,2B parametri totali, 3,8B attivi per token

Gemma 4 26B A4B utilizza un design MoE sparso con 8 esperti attivi su 128 totali, più 1 esperto condiviso. Tutti i 26B parametri vengono caricati in memoria per un routing rapido, ma il costo di inferenza resta vicino a quello di un modello denso da 4B.

Ideale per distribuzioni in produzione ad alto throughput dove serve qualità vicina al 31B a una frazione del costo computazionale.

Instruction-tuned

26B Instruct

Ottimizzato per l'IA conversazionale e il completamento di attività complesse

Perfezionato con RLHF per seguire istruzioni e dialoghi multi-turno

Disponibile ora

Pre-addestrato

26B Base

Modello MoE fondazionale per il fine-tuning e le applicazioni specializzate

Pre-addestrato su dati multimodali diversificati con routing sparso degli esperti

Disponibile ora

Funzionalità

Prestazioni di frontiera al costo di inferenza di 4B

Gemma 4 26B A4B combina l'efficienza MoE con ragionamento avanzato, programmazione eccezionale e comprensione multimodale, offrendo qualità vicina al 31B a una frazione del costo computazionale.

Efficienza MoE

Attiva solo 3,8B parametri per token da un pool di 25,2B. Qualità vicina al 31B al costo di inferenza di ~4B: il miglior rapporto di efficienza nella famiglia Gemma 4.

Ragionamento avanzato

La modalità di pensiero configurabile consente un ragionamento passo dopo passo. Raggiunge l'88,3% su AIME 2026 in matematica, a soli 0,9 punti dal modello denso 31B.

Programmazione eccezionale

77,1% su LiveCodeBench v6 e 1718 Codeforces ELO. Function calling nativo per flussi di lavoro agentici ed esecuzione autonoma del codice.

Finestra di contesto da 256K

Contesto esteso per intere codebase, documenti lunghi e conversazioni multi-turno. Attenzione ibrida locale/globale per l'efficienza della memoria.

Comprensione multimodale

Elabora testo e immagini con proporzioni variabili. 73,8% su MMMU Pro e 82,4% su MATH-Vision per il ragionamento visivo.

Oltre 140 lingue

Supporto multilingue con comprensione del contesto culturale. 82,6% su MMLU Pro su diversi domini di conoscenza.

Punti chiave

Metriche di prestazione eccezionali

Gemma 4 26B A4B raggiunge risultati vicini al 31B su diversi benchmark attivando solo 3,8B parametri per token.

Risultati principali

  • Arena AI ELO 1441 - competitivo con il modello denso 31B
  • 88,3% su AIME 2026 in matematica (senza strumenti)
  • 77,1% su LiveCodeBench v6 nella programmazione
  • 82,3% su GPQA Diamond per le conoscenze scientifiche
  • 85,5% su t2-bench per l'uso agentico di strumenti

Specifiche tecniche

  • 25,2B parametri totali, 3,8B attivi per token
  • 8 esperti attivi + 1 condiviso su 128 totali
  • Finestra di contesto da 256K token
  • Supporto per oltre 140 lingue
  • Meccanismo di attenzione ibrido locale/globale

Prestazioni

Qualità vicina al 31B al costo di inferenza di 4B

Gemma 4 26B A4B raggiunge l'88,3% su AIME 2026 e l'82,6% su MMLU Pro, entro l'1% dal modello denso 31B, attivando solo 3,8B parametri per token.

Gemma 4 26B A4B dimostra un'eccellenza costante nei benchmark di ragionamento, programmazione, multimodalità e capacità agentiche, entro l'1-3% dal modello denso 31B in ogni attività.

Grafico comparativo delle prestazioni di Gemma 4 26B A4B

Arena AI ELO 1441 - competitivo con il modello denso 31B

88,3% su AIME 2026 in matematica (senza strumenti)

77,1% su LiveCodeBench v6 nella programmazione competitiva

82,3% su GPQA Diamond per le conoscenze scientifiche

85,5% su t2-bench per l'uso agentico di strumenti

Confronto benchmark

26B MoE vs 31B denso e la famiglia Gemma 4

Gemma 4 26B A4B offre prestazioni vicine al 31B nel ragionamento, nella programmazione, nelle attività multimodali e agentiche a una frazione del costo di inferenza.

Benchmark
Gemma 4 26B A4B IT
Thinking
In evidenza
Gemma 4 31B IT
Thinking
Gemma 4 E4B IT
Thinking
Gemma 3 27B IT
Arena AI (text)
Al 2 aprile 2026
14411452-1365
MMLU Pro
Conoscenza e ragionamento
Senza strumenti
82.6%85.2%69.4%67.6%
MMMU Pro
Ragionamento multimodale
73.8%76.9%52.6%49.7%
AIME 2026
Matematica
Senza strumenti
88.3%89.2%42.5%20.8%
LiveCodeBench v6
Programmazione competitiva
77.1%80.0%52.0%29.1%
GPQA Diamond
Conoscenze scientifiche
Senza strumenti
82.3%84.3%58.6%42.4%
t2-bench
Uso agentico di strumenti
Retail
85.5%86.4%57.5%6.6%

Risultati dei benchmark dalla scheda ufficiale del modello Gemma 4. Punteggi Arena AI aggiornati al 2 aprile 2026.

Architettura MoE

Capacità da 26B, costo di inferenza da 4B

Il design Mixture-of-Experts instrada ogni token attraverso 8 dei 128 esperti più 1 esperto condiviso. Tutti i 26B parametri restano in memoria per un routing istantaneo, ma solo 3,8B si attivano per ogni passaggio, offrendo qualità vicina al 31B a una frazione del costo computazionale.

  • 3,8B parametri attivi per token da una capacità totale di 25,2B
  • 8 esperti attivi + 1 condiviso su 128 esperti totali
  • RoPE proporzionale (p-RoPE) per una gestione efficiente del contesto da 256K
Gemma 4 26B A4B MoE architecture

Ragionamento avanzato

88,3% su AIME 2026 - entro l'1% dal modello 31B

La modalità di pensiero configurabile consente un ragionamento trasparente passo dopo passo per la matematica, la logica e la risoluzione di problemi a più passaggi. Il MoE da 26B colma il divario con il modello denso 31B a meno di 1 punto percentuale sui benchmark matematici più difficili.

  • 88,3% su AIME 2026 in matematica (senza strumenti)
  • 82,3% su GPQA Diamond per le scienze a livello universitario avanzato
  • Modalità di ragionamento integrata con spiegazioni passo dopo passo
Gemma 4 26B A4B advanced reasoning

Eccellenza nella programmazione

77,1% su LiveCodeBench v6 con function calling nativo

Con il 77,1% su LiveCodeBench v6 e 1718 Codeforces ELO, Gemma 4 26B A4B eccelle nella generazione di codice, nel debugging e nei flussi di lavoro agentici. Il function calling nativo consente agenti autonomi senza fine-tuning.

  • 77,1% sui problemi di programmazione competitiva LiveCodeBench v6
  • 1718 Codeforces ELO rating
  • Function calling nativo per agenti autonomi
Gemma 4 26B A4B coding excellence

Comprensione multimodale

Elaborazione di testo e immagini con risoluzione variabile

Elabora testo e immagini insieme con supporto per proporzioni e risoluzioni variabili. 73,8% su MMMU Pro e 82,4% su MATH-Vision dimostrano un forte ragionamento visivo e comprensione dei documenti.

  • 73,8% su MMMU Pro per il ragionamento multimodale
  • 82,4% su MATH-Vision per i problemi di matematica visiva
  • Supporto per risoluzioni di immagine variabili (70-1120 token)
Gemma 4 26B A4B multimodal understanding

Scarica i pesi

Distribuzione self-hosted

Scarica i pesi ufficiali del modello per la distribuzione sulla tua infrastruttura.

Distribuzione e scalabilità

Opzioni di distribuzione in produzione

Distribuzione enterprise-ready su Google Cloud, Kubernetes o sulla tua infrastruttura.

Entra nel Gemmaverse

Parte del più ampio ecosistema Gemma

Gemma 4 26B A4B fa parte della famiglia di modelli aperti di Google, con un ampio supporto della community, integrazioni e risorse.

Documentazione

Guide complete per l'integrazione e la distribuzione

Leggi la documentazione

Sicurezza e responsabilità

Sviluppo etico dell'IA e linee guida sulla sicurezza

Scopri di più

Scheda del modello

Specifiche tecniche e risultati delle valutazioni

Visualizza i dettagli

Repository GitHub

Codice sorgente, esempi e contributi della community

Visualizza il codice

HuggingFace

Scarica i pesi ed esplora l'hub dei modelli

Scarica

Distribuzione cloud

Distribuzione enterprise su Google Cloud

Distribuisci

Per iniziare

Pronto a costruire con Gemma 4 26B A4B?

Inizia a chattare all'istante e gratuitamente, oppure scarica il modello per una distribuzione self-hosted sulla tua infrastruttura.