Gemma 4 26B A4B
26 miliardi di parametri, 4 miliardi attivi - intelligenza di frontiera alla velocità di inferenza
Gemma 4 26B A4B è un modello Mixture-of-Experts che attiva solo 4B parametri per token offrendo qualità vicina al 31B. Con contesto da 256K, oltre 140 lingue e l'88,3% su AIME 2026, è il percorso più efficiente verso un ragionamento di classe frontiera.
Varianti del modello
Modelli instruction-tuned e base
Scegli tra la variante instruction-tuned ottimizzata per la chat e il completamento di attività, oppure il modello base per il fine-tuning e le applicazioni specializzate.
Architettura Mixture-of-Experts
25,2B parametri totali, 3,8B attivi per token
Gemma 4 26B A4B utilizza un design MoE sparso con 8 esperti attivi su 128 totali, più 1 esperto condiviso. Tutti i 26B parametri vengono caricati in memoria per un routing rapido, ma il costo di inferenza resta vicino a quello di un modello denso da 4B.
Ideale per distribuzioni in produzione ad alto throughput dove serve qualità vicina al 31B a una frazione del costo computazionale.
Instruction-tuned
26B Instruct
Ottimizzato per l'IA conversazionale e il completamento di attività complesse
Perfezionato con RLHF per seguire istruzioni e dialoghi multi-turno
Pre-addestrato
26B Base
Modello MoE fondazionale per il fine-tuning e le applicazioni specializzate
Pre-addestrato su dati multimodali diversificati con routing sparso degli esperti
Funzionalità
Prestazioni di frontiera al costo di inferenza di 4B
Gemma 4 26B A4B combina l'efficienza MoE con ragionamento avanzato, programmazione eccezionale e comprensione multimodale, offrendo qualità vicina al 31B a una frazione del costo computazionale.
Efficienza MoE
Attiva solo 3,8B parametri per token da un pool di 25,2B. Qualità vicina al 31B al costo di inferenza di ~4B: il miglior rapporto di efficienza nella famiglia Gemma 4.
Ragionamento avanzato
La modalità di pensiero configurabile consente un ragionamento passo dopo passo. Raggiunge l'88,3% su AIME 2026 in matematica, a soli 0,9 punti dal modello denso 31B.
Programmazione eccezionale
77,1% su LiveCodeBench v6 e 1718 Codeforces ELO. Function calling nativo per flussi di lavoro agentici ed esecuzione autonoma del codice.
Finestra di contesto da 256K
Contesto esteso per intere codebase, documenti lunghi e conversazioni multi-turno. Attenzione ibrida locale/globale per l'efficienza della memoria.
Comprensione multimodale
Elabora testo e immagini con proporzioni variabili. 73,8% su MMMU Pro e 82,4% su MATH-Vision per il ragionamento visivo.
Oltre 140 lingue
Supporto multilingue con comprensione del contesto culturale. 82,6% su MMLU Pro su diversi domini di conoscenza.
Punti chiave
Metriche di prestazione eccezionali
Gemma 4 26B A4B raggiunge risultati vicini al 31B su diversi benchmark attivando solo 3,8B parametri per token.
Risultati principali
- Arena AI ELO 1441 - competitivo con il modello denso 31B
- 88,3% su AIME 2026 in matematica (senza strumenti)
- 77,1% su LiveCodeBench v6 nella programmazione
- 82,3% su GPQA Diamond per le conoscenze scientifiche
- 85,5% su t2-bench per l'uso agentico di strumenti
Specifiche tecniche
- 25,2B parametri totali, 3,8B attivi per token
- 8 esperti attivi + 1 condiviso su 128 totali
- Finestra di contesto da 256K token
- Supporto per oltre 140 lingue
- Meccanismo di attenzione ibrido locale/globale
Prestazioni
Qualità vicina al 31B al costo di inferenza di 4B
Gemma 4 26B A4B raggiunge l'88,3% su AIME 2026 e l'82,6% su MMLU Pro, entro l'1% dal modello denso 31B, attivando solo 3,8B parametri per token.
Gemma 4 26B A4B dimostra un'eccellenza costante nei benchmark di ragionamento, programmazione, multimodalità e capacità agentiche, entro l'1-3% dal modello denso 31B in ogni attività.
Arena AI ELO 1441 - competitivo con il modello denso 31B
88,3% su AIME 2026 in matematica (senza strumenti)
77,1% su LiveCodeBench v6 nella programmazione competitiva
82,3% su GPQA Diamond per le conoscenze scientifiche
85,5% su t2-bench per l'uso agentico di strumenti
Confronto benchmark
26B MoE vs 31B denso e la famiglia Gemma 4
Gemma 4 26B A4B offre prestazioni vicine al 31B nel ragionamento, nella programmazione, nelle attività multimodali e agentiche a una frazione del costo di inferenza.
| Benchmark | Gemma 4 26B A4B IT Thinking In evidenza | Gemma 4 31B IT Thinking | Gemma 4 E4B IT Thinking | Gemma 3 27B IT |
|---|---|---|---|---|
Arena AI (text) Al 2 aprile 2026 | 1441 | 1452 | - | 1365 |
MMLU Pro Conoscenza e ragionamento Senza strumenti | 82.6% | 85.2% | 69.4% | 67.6% |
MMMU Pro Ragionamento multimodale | 73.8% | 76.9% | 52.6% | 49.7% |
AIME 2026 Matematica Senza strumenti | 88.3% | 89.2% | 42.5% | 20.8% |
LiveCodeBench v6 Programmazione competitiva | 77.1% | 80.0% | 52.0% | 29.1% |
GPQA Diamond Conoscenze scientifiche Senza strumenti | 82.3% | 84.3% | 58.6% | 42.4% |
t2-bench Uso agentico di strumenti Retail | 85.5% | 86.4% | 57.5% | 6.6% |
Risultati dei benchmark dalla scheda ufficiale del modello Gemma 4. Punteggi Arena AI aggiornati al 2 aprile 2026.
Architettura MoE
Capacità da 26B, costo di inferenza da 4B
Il design Mixture-of-Experts instrada ogni token attraverso 8 dei 128 esperti più 1 esperto condiviso. Tutti i 26B parametri restano in memoria per un routing istantaneo, ma solo 3,8B si attivano per ogni passaggio, offrendo qualità vicina al 31B a una frazione del costo computazionale.
- 3,8B parametri attivi per token da una capacità totale di 25,2B
- 8 esperti attivi + 1 condiviso su 128 esperti totali
- RoPE proporzionale (p-RoPE) per una gestione efficiente del contesto da 256K
Ragionamento avanzato
88,3% su AIME 2026 - entro l'1% dal modello 31B
La modalità di pensiero configurabile consente un ragionamento trasparente passo dopo passo per la matematica, la logica e la risoluzione di problemi a più passaggi. Il MoE da 26B colma il divario con il modello denso 31B a meno di 1 punto percentuale sui benchmark matematici più difficili.
- 88,3% su AIME 2026 in matematica (senza strumenti)
- 82,3% su GPQA Diamond per le scienze a livello universitario avanzato
- Modalità di ragionamento integrata con spiegazioni passo dopo passo
Eccellenza nella programmazione
77,1% su LiveCodeBench v6 con function calling nativo
Con il 77,1% su LiveCodeBench v6 e 1718 Codeforces ELO, Gemma 4 26B A4B eccelle nella generazione di codice, nel debugging e nei flussi di lavoro agentici. Il function calling nativo consente agenti autonomi senza fine-tuning.
- 77,1% sui problemi di programmazione competitiva LiveCodeBench v6
- 1718 Codeforces ELO rating
- Function calling nativo per agenti autonomi
Comprensione multimodale
Elaborazione di testo e immagini con risoluzione variabile
Elabora testo e immagini insieme con supporto per proporzioni e risoluzioni variabili. 73,8% su MMMU Pro e 82,4% su MATH-Vision dimostrano un forte ragionamento visivo e comprensione dei documenti.
- 73,8% su MMMU Pro per il ragionamento multimodale
- 82,4% su MATH-Vision per i problemi di matematica visiva
- Supporto per risoluzioni di immagine variabili (70-1120 token)
Per iniziare
Prova subito Gemma 4 26B
Inizia a chattare all'istante, oppure scarica i pesi per una distribuzione self-hosted.
Scarica i pesi
Distribuzione self-hosted
Scarica i pesi ufficiali del modello per la distribuzione sulla tua infrastruttura.
Distribuzione e scalabilità
Opzioni di distribuzione in produzione
Distribuzione enterprise-ready su Google Cloud, Kubernetes o sulla tua infrastruttura.
Entra nel Gemmaverse
Parte del più ampio ecosistema Gemma
Gemma 4 26B A4B fa parte della famiglia di modelli aperti di Google, con un ampio supporto della community, integrazioni e risorse.
Per iniziare
Pronto a costruire con Gemma 4 26B A4B?
Inizia a chattare all'istante e gratuitamente, oppure scarica il modello per una distribuzione self-hosted sulla tua infrastruttura.