Gemma 4 26B A4B

26 miliardi di parametri, 4 miliardi attivi - intelligenza di frontiera alla velocità di inferenza

Gemma 4 26B A4B è un modello Mixture-of-Experts che attiva solo 4B parametri per token offrendo qualità vicina al 31B. Con contesto da 256K, oltre 140 lingue e l'88,3% su AIME 2026, è il percorso più efficiente verso un ragionamento di classe frontiera.

Inizia a chattare Visualizza i benchmark

Varianti del modello

Modelli instruction-tuned e base

Scegli tra la variante instruction-tuned ottimizzata per la chat e il completamento di attività, oppure il modello base per il fine-tuning e le applicazioni specializzate.

Architettura Mixture-of-Experts

25,2B parametri totali, 3,8B attivi per token

Gemma 4 26B A4B utilizza un design MoE sparso con 8 esperti attivi su 128 totali, più 1 esperto condiviso. Tutti i 26B parametri vengono caricati in memoria per un routing rapido, ma il costo di inferenza resta vicino a quello di un modello denso da 4B.

Ideale per distribuzioni in produzione ad alto throughput dove serve qualità vicina al 31B a una frazione del costo computazionale.

Inizia a chattare Scopri le funzionalità

Instruction-tuned

26B Instruct

Ottimizzato per l'IA conversazionale e il completamento di attività complesse

Perfezionato con RLHF per seguire istruzioni e dialoghi multi-turno

Disponibile ora

Inizia a chattare Scarica i pesi

Pre-addestrato

26B Base

Modello MoE fondazionale per il fine-tuning e le applicazioni specializzate

Pre-addestrato su dati multimodali diversificati con routing sparso degli esperti

Disponibile ora

Visualizza su HuggingFace Guida al fine-tuning

Funzionalità

Prestazioni di frontiera al costo di inferenza di 4B

Gemma 4 26B A4B combina l'efficienza MoE con ragionamento avanzato, programmazione eccezionale e comprensione multimodale, offrendo qualità vicina al 31B a una frazione del costo computazionale.

Efficienza MoE

Attiva solo 3,8B parametri per token da un pool di 25,2B. Qualità vicina al 31B al costo di inferenza di ~4B: il miglior rapporto di efficienza nella famiglia Gemma 4.

Ragionamento avanzato

La modalità di pensiero configurabile consente un ragionamento passo dopo passo. Raggiunge l'88,3% su AIME 2026 in matematica, a soli 0,9 punti dal modello denso 31B.

Programmazione eccezionale

77,1% su LiveCodeBench v6 e 1718 Codeforces ELO. Function calling nativo per flussi di lavoro agentici ed esecuzione autonoma del codice.

Finestra di contesto da 256K

Contesto esteso per intere codebase, documenti lunghi e conversazioni multi-turno. Attenzione ibrida locale/globale per l'efficienza della memoria.

Comprensione multimodale

Elabora testo e immagini con proporzioni variabili. 73,8% su MMMU Pro e 82,4% su MATH-Vision per il ragionamento visivo.

Oltre 140 lingue

Supporto multilingue con comprensione del contesto culturale. 82,6% su MMLU Pro su diversi domini di conoscenza.

Punti chiave

Metriche di prestazione eccezionali

Gemma 4 26B A4B raggiunge risultati vicini al 31B su diversi benchmark attivando solo 3,8B parametri per token.

Risultati principali

Arena AI ELO 1441 - competitivo con il modello denso 31B
88,3% su AIME 2026 in matematica (senza strumenti)
77,1% su LiveCodeBench v6 nella programmazione
82,3% su GPQA Diamond per le conoscenze scientifiche
85,5% su t2-bench per l'uso agentico di strumenti

Specifiche tecniche

25,2B parametri totali, 3,8B attivi per token
8 esperti attivi + 1 condiviso su 128 totali
Finestra di contesto da 256K token
Supporto per oltre 140 lingue
Meccanismo di attenzione ibrido locale/globale

Inizia a chattare gratis Scarica i pesi

Prestazioni

Qualità vicina al 31B al costo di inferenza di 4B

Gemma 4 26B A4B raggiunge l'88,3% su AIME 2026 e l'82,6% su MMLU Pro, entro l'1% dal modello denso 31B, attivando solo 3,8B parametri per token.

Gemma 4 26B A4B dimostra un'eccellenza costante nei benchmark di ragionamento, programmazione, multimodalità e capacità agentiche, entro l'1-3% dal modello denso 31B in ogni attività.

Inizia a chattare Visualizza la scheda del modello

Grafico comparativo delle prestazioni di Gemma 4 26B A4B

Arena AI ELO 1441 - competitivo con il modello denso 31B

88,3% su AIME 2026 in matematica (senza strumenti)

77,1% su LiveCodeBench v6 nella programmazione competitiva

82,3% su GPQA Diamond per le conoscenze scientifiche

85,5% su t2-bench per l'uso agentico di strumenti

Confronto benchmark

26B MoE vs 31B denso e la famiglia Gemma 4

Gemma 4 26B A4B offre prestazioni vicine al 31B nel ragionamento, nella programmazione, nelle attività multimodali e agentiche a una frazione del costo di inferenza.

Benchmark	Gemma 4 26B A4B IT Thinking In evidenza	Gemma 4 31B IT Thinking	Gemma 4 E4B IT Thinking	Gemma 3 27B IT
Arena AI (text) Al 2 aprile 2026	1441	1452	-	1365
MMLU Pro Conoscenza e ragionamento Senza strumenti	82.6%	85.2%	69.4%	67.6%
MMMU Pro Ragionamento multimodale	73.8%	76.9%	52.6%	49.7%
AIME 2026 Matematica Senza strumenti	88.3%	89.2%	42.5%	20.8%
LiveCodeBench v6 Programmazione competitiva	77.1%	80.0%	52.0%	29.1%
GPQA Diamond Conoscenze scientifiche Senza strumenti	82.3%	84.3%	58.6%	42.4%
t2-bench Uso agentico di strumenti Retail	85.5%	86.4%	57.5%	6.6%

Risultati dei benchmark dalla scheda ufficiale del modello Gemma 4. Punteggi Arena AI aggiornati al 2 aprile 2026.

Architettura MoE

Capacità da 26B, costo di inferenza da 4B

Il design Mixture-of-Experts instrada ogni token attraverso 8 dei 128 esperti più 1 esperto condiviso. Tutti i 26B parametri restano in memoria per un routing istantaneo, ma solo 3,8B si attivano per ogni passaggio, offrendo qualità vicina al 31B a una frazione del costo computazionale.

3,8B parametri attivi per token da una capacità totale di 25,2B
8 esperti attivi + 1 condiviso su 128 esperti totali
RoPE proporzionale (p-RoPE) per una gestione efficiente del contesto da 256K

Inizia a chattare Visualizza i benchmark

Ragionamento avanzato

88,3% su AIME 2026 - entro l'1% dal modello 31B

La modalità di pensiero configurabile consente un ragionamento trasparente passo dopo passo per la matematica, la logica e la risoluzione di problemi a più passaggi. Il MoE da 26B colma il divario con il modello denso 31B a meno di 1 punto percentuale sui benchmark matematici più difficili.

88,3% su AIME 2026 in matematica (senza strumenti)
82,3% su GPQA Diamond per le scienze a livello universitario avanzato
Modalità di ragionamento integrata con spiegazioni passo dopo passo

Prova le attività di ragionamento Visualizza i benchmark

Eccellenza nella programmazione

77,1% su LiveCodeBench v6 con function calling nativo

Con il 77,1% su LiveCodeBench v6 e 1718 Codeforces ELO, Gemma 4 26B A4B eccelle nella generazione di codice, nel debugging e nei flussi di lavoro agentici. Il function calling nativo consente agenti autonomi senza fine-tuning.

77,1% sui problemi di programmazione competitiva LiveCodeBench v6
1718 Codeforces ELO rating
Function calling nativo per agenti autonomi

Testa le attività di programmazione Documentazione per l'integrazione

Comprensione multimodale

Elaborazione di testo e immagini con risoluzione variabile

Elabora testo e immagini insieme con supporto per proporzioni e risoluzioni variabili. 73,8% su MMMU Pro e 82,4% su MATH-Vision dimostrano un forte ragionamento visivo e comprensione dei documenti.