Gemma 4 26B A4B
26 miljard parameters, 4 miljard actief - frontier-intelligentie op inferentiesnelheid
Gemma 4 26B A4B is een Mixture-of-Experts model dat slechts 4B parameters per token activeert en toch bijna 31B-kwaliteit levert. Met 256K context, meer dan 140 talen en 88.3% op AIME 2026 is het de meest efficiënte weg naar frontier-klasse redeneren.
Modelvarianten
Instruction-tuned en basismodellen
Kies tussen de instruction-tuned variant, geoptimaliseerd voor chat en taakvoltooiing, of het basismodel voor fine-tuning en gespecialiseerde toepassingen.
Mixture-of-Experts Architectuur
25.2B totale parameters, 3.8B actief per token
Gemma 4 26B A4B gebruikt een sparse MoE-ontwerp met 8 actieve experts uit 128 totaal, plus 1 gedeelde expert. Alle 26B parameters blijven in het geheugen voor snelle routering, maar de inferentiekosten blijven vergelijkbaar met een 4B dense model.
Ideaal voor high-throughput productie-implementaties waar u bijna 31B-kwaliteit nodig hebt tegen een fractie van de rekenkosten.
Instruction-tuned
26B Instruct
Geoptimaliseerd voor conversationele AI en complexe taakvoltooiing
Verfijnd met RLHF voor het opvolgen van instructies en meervoudige dialoog
Voorgetraind
26B Base
Basis MoE-model voor fine-tuning en gespecialiseerde toepassingen
Voorgetraind op diverse multimodale data met sparse expert-routering
Mogelijkheden
Frontier-niveau prestaties tegen 4B inferentiekosten
Gemma 4 26B A4B combineert MoE-efficiëntie met geavanceerd redeneren, uitzonderlijk programmeren en multimodaal begrip - en levert bijna 31B-kwaliteit tegen een fractie van de rekenkosten.
MoE-efficiëntie
Activeert slechts 3.8B parameters per token uit een pool van 25.2B. Bijna 31B-kwaliteit tegen ~4B inferentiekosten - de beste efficiëntieverhouding in de Gemma 4-familie.
Geavanceerd redeneren
Configureerbare denkmodus maakt stapsgewijs redeneren mogelijk. Behaalt 88.3% op AIME 2026 wiskunde - slechts 0.9 punt achter het 31B dense model.
Uitzonderlijk programmeren
77.1% op LiveCodeBench v6 en 1718 Codeforces ELO. Native function calling voor agentische workflows en autonome code-uitvoering.
256K contextvenster
Uitgebreide context voor volledige codebases, lange documenten en meervoudige gesprekken. Hybride lokale/globale attention voor geheugenefficiëntie.
Multimodaal begrip
Verwerkt tekst en afbeeldingen met variabele beeldverhoudingen. 73.8% op MMMU Pro en 82.4% op MATH-Vision voor visueel redeneren.
Meer dan 140 talen
Meertalige ondersteuning met cultureel contextbegrip. 82.6% op MMLU Pro over diverse kennisdomeinen.
Belangrijkste hoogtepunten
Uitzonderlijke prestatiemetrieken
Gemma 4 26B A4B behaalt bijna 31B-resultaten over diverse benchmarks terwijl slechts 3.8B parameters per token worden geactiveerd.
Topprestaties
- Arena AI ELO 1441 - concurrerend met het 31B dense model
- 88.3% op AIME 2026 wiskunde (zonder tools)
- 77.1% op LiveCodeBench v6 programmeren
- 82.3% op GPQA Diamond wetenschappelijke kennis
- 85.5% op t2-bench agentisch toolgebruik
Technische specificaties
- 25.2B totale parameters, 3.8B actief per token
- 8 actieve + 1 gedeelde expert uit 128 totaal
- 256K token contextvenster
- Ondersteuning voor meer dan 140 talen
- Hybride lokaal/globaal attention-mechanisme
Prestaties
Bijna 31B-kwaliteit tegen 4B inferentiekosten
Gemma 4 26B A4B behaalt 88.3% op AIME 2026 en 82.6% op MMLU Pro - binnen 1% van het 31B dense model - terwijl slechts 3.8B parameters per token worden geactiveerd.
Gemma 4 26B A4B toont consistente excellentie over redeneer-, programmeer-, multimodale en agentische benchmarks - binnen 1-3% van het 31B dense model op elke taak.
Arena AI ELO 1441 - concurrerend met het 31B dense model
88.3% op AIME 2026 wiskunde (zonder tools)
77.1% op LiveCodeBench v6 competitief programmeren
82.3% op GPQA Diamond wetenschappelijke kennis
85.5% op t2-bench agentisch toolgebruik
Benchmarkvergelijking
26B MoE vs 31B Dense en de Gemma 4-familie
Gemma 4 26B A4B levert bijna 31B-prestaties over redeneer-, programmeer-, multimodale en agentische taken tegen een fractie van de inferentiekosten.
| Benchmark | Gemma 4 26B A4B IT Thinking Uitgelicht | Gemma 4 31B IT Thinking | Gemma 4 E4B IT Thinking | Gemma 3 27B IT |
|---|---|---|---|---|
Arena AI (text) Per 2 april 2026 | 1441 | 1452 | - | 1365 |
MMLU Pro Kennis & redeneren Zonder tools | 82.6% | 85.2% | 69.4% | 67.6% |
MMMU Pro Multimodaal redeneren | 73.8% | 76.9% | 52.6% | 49.7% |
AIME 2026 Wiskunde Zonder tools | 88.3% | 89.2% | 42.5% | 20.8% |
LiveCodeBench v6 Competitief programmeren | 77.1% | 80.0% | 52.0% | 29.1% |
GPQA Diamond Wetenschappelijke kennis Zonder tools | 82.3% | 84.3% | 58.6% | 42.4% |
t2-bench Agentisch toolgebruik Retail | 85.5% | 86.4% | 57.5% | 6.6% |
Benchmarkresultaten uit de officiële Gemma 4 modelkaart. Arena AI-scores per 2 april 2026.
MoE-architectuur
26B capaciteit, 4B inferentiekosten
Het Mixture-of-Experts ontwerp routeert elk token door 8 van de 128 experts plus 1 gedeelde expert. Alle 26B parameters blijven in het geheugen voor directe routering, maar slechts 3.8B worden geactiveerd per forward pass - wat bijna 31B-kwaliteit levert tegen een fractie van de rekenkosten.
- 3.8B actieve parameters per token uit 25.2B totale capaciteit
- 8 actieve + 1 gedeelde expert uit 128 totale experts
- Proportional RoPE (p-RoPE) voor efficiënte 256K contextverwerking
Geavanceerd Redeneren
88.3% op AIME 2026 - binnen 1% van het 31B model
Configureerbare denkmodus maakt transparant stapsgewijs redeneren mogelijk voor wiskunde, logica en meerstaps probleemoplossing. Het 26B MoE verkleint het verschil met het 31B dense model tot minder dan 1 procentpunt op de moeilijkste wiskundebenchmarks.
- 88.3% op AIME 2026 wiskunde (zonder tools)
- 82.3% op GPQA Diamond wetenschap op graduate-niveau
- Ingebouwde redeneermodus met stapsgewijze uitleg
Programmeerexcellentie
77.1% LiveCodeBench v6 met native function calling
Met 77.1% op LiveCodeBench v6 en 1718 Codeforces ELO blinkt Gemma 4 26B A4B uit in codegeneratie, debugging en agentische workflows. Native function calling maakt autonome agents mogelijk zonder fine-tuning.
- 77.1% op LiveCodeBench v6 competitieve programmeerproblemen
- 1718 Codeforces ELO-rating
- Native function calling voor autonome agents
Multimodaal Begrip
Tekst- en beeldverwerking met variabele resolutie
Verwerk tekst en afbeeldingen samen met ondersteuning voor variabele beeldverhoudingen en resoluties. 73.8% op MMMU Pro en 82.4% op MATH-Vision tonen sterk visueel redeneren en documentbegrip.
- 73.8% op MMMU Pro multimodaal redeneren
- 82.4% op MATH-Vision visuele wiskundeproblemen
- Ondersteuning voor variabele beeldresolutie (70-1120 tokens)
Aan de slag
Probeer Gemma 4 26B nu
Begin direct met chatten, of download gewichten voor zelf-gehoste implementatie.
Gewichten downloaden
Zelf-gehoste implementatie
Download officiële modelgewichten voor implementatie op uw eigen infrastructuur.
Implementeren en schalen
Productie-implementatieopties
Enterprise-ready implementatie op Google Cloud, Kubernetes of uw eigen infrastructuur.
Ontdek de Gemmaverse
Onderdeel van het bredere Gemma-ecosysteem
Gemma 4 26B A4B maakt deel uit van Google's open modelfamilie, met uitgebreide community-ondersteuning, integraties en bronnen.
Aan de slag
Klaar om te bouwen met Gemma 4 26B A4B?
Begin direct gratis met chatten, of download het model voor zelf-gehoste implementatie op uw eigen infrastructuur.