Gemma 4 26B A4B

26 miljard parameters, 4 miljard actief - frontier-intelligentie op inferentiesnelheid

Gemma 4 26B A4B is een Mixture-of-Experts model dat slechts 4B parameters per token activeert en toch bijna 31B-kwaliteit levert. Met 256K context, meer dan 140 talen en 88.3% op AIME 2026 is het de meest efficiënte weg naar frontier-klasse redeneren.

Begin met Chatten Bekijk benchmarks

Modelvarianten

Instruction-tuned en basismodellen

Kies tussen de instruction-tuned variant, geoptimaliseerd voor chat en taakvoltooiing, of het basismodel voor fine-tuning en gespecialiseerde toepassingen.

Mixture-of-Experts Architectuur

25.2B totale parameters, 3.8B actief per token

Gemma 4 26B A4B gebruikt een sparse MoE-ontwerp met 8 actieve experts uit 128 totaal, plus 1 gedeelde expert. Alle 26B parameters blijven in het geheugen voor snelle routering, maar de inferentiekosten blijven vergelijkbaar met een 4B dense model.

Ideaal voor high-throughput productie-implementaties waar u bijna 31B-kwaliteit nodig hebt tegen een fractie van de rekenkosten.

Begin met Chatten Bekijk mogelijkheden

Instruction-tuned

26B Instruct

Geoptimaliseerd voor conversationele AI en complexe taakvoltooiing

Verfijnd met RLHF voor het opvolgen van instructies en meervoudige dialoog

Nu beschikbaar

Begin met Chatten Gewichten downloaden

Voorgetraind

26B Base

Basis MoE-model voor fine-tuning en gespecialiseerde toepassingen

Voorgetraind op diverse multimodale data met sparse expert-routering

Nu beschikbaar

Bekijk op HuggingFace Fine-tuning handleiding

Mogelijkheden

Frontier-niveau prestaties tegen 4B inferentiekosten

Gemma 4 26B A4B combineert MoE-efficiëntie met geavanceerd redeneren, uitzonderlijk programmeren en multimodaal begrip - en levert bijna 31B-kwaliteit tegen een fractie van de rekenkosten.

MoE-efficiëntie

Activeert slechts 3.8B parameters per token uit een pool van 25.2B. Bijna 31B-kwaliteit tegen ~4B inferentiekosten - de beste efficiëntieverhouding in de Gemma 4-familie.

Geavanceerd redeneren

Configureerbare denkmodus maakt stapsgewijs redeneren mogelijk. Behaalt 88.3% op AIME 2026 wiskunde - slechts 0.9 punt achter het 31B dense model.

Uitzonderlijk programmeren

77.1% op LiveCodeBench v6 en 1718 Codeforces ELO. Native function calling voor agentische workflows en autonome code-uitvoering.

256K contextvenster

Uitgebreide context voor volledige codebases, lange documenten en meervoudige gesprekken. Hybride lokale/globale attention voor geheugenefficiëntie.

Multimodaal begrip

Verwerkt tekst en afbeeldingen met variabele beeldverhoudingen. 73.8% op MMMU Pro en 82.4% op MATH-Vision voor visueel redeneren.

Meer dan 140 talen

Meertalige ondersteuning met cultureel contextbegrip. 82.6% op MMLU Pro over diverse kennisdomeinen.

Belangrijkste hoogtepunten

Uitzonderlijke prestatiemetrieken

Gemma 4 26B A4B behaalt bijna 31B-resultaten over diverse benchmarks terwijl slechts 3.8B parameters per token worden geactiveerd.

Topprestaties

Arena AI ELO 1441 - concurrerend met het 31B dense model
88.3% op AIME 2026 wiskunde (zonder tools)
77.1% op LiveCodeBench v6 programmeren
82.3% op GPQA Diamond wetenschappelijke kennis
85.5% op t2-bench agentisch toolgebruik

Technische specificaties

25.2B totale parameters, 3.8B actief per token
8 actieve + 1 gedeelde expert uit 128 totaal
256K token contextvenster
Ondersteuning voor meer dan 140 talen
Hybride lokaal/globaal attention-mechanisme

Start Gratis Chat Gewichten downloaden

Prestaties

Bijna 31B-kwaliteit tegen 4B inferentiekosten

Gemma 4 26B A4B behaalt 88.3% op AIME 2026 en 82.6% op MMLU Pro - binnen 1% van het 31B dense model - terwijl slechts 3.8B parameters per token worden geactiveerd.

Gemma 4 26B A4B toont consistente excellentie over redeneer-, programmeer-, multimodale en agentische benchmarks - binnen 1-3% van het 31B dense model op elke taak.

Begin met Chatten Bekijk modelkaart

Gemma 4 26B A4B prestatievergelijkingsgrafiek

Arena AI ELO 1441 - concurrerend met het 31B dense model

88.3% op AIME 2026 wiskunde (zonder tools)

77.1% op LiveCodeBench v6 competitief programmeren

82.3% op GPQA Diamond wetenschappelijke kennis

85.5% op t2-bench agentisch toolgebruik

Benchmarkvergelijking

26B MoE vs 31B Dense en de Gemma 4-familie

Gemma 4 26B A4B levert bijna 31B-prestaties over redeneer-, programmeer-, multimodale en agentische taken tegen een fractie van de inferentiekosten.

Benchmark	Gemma 4 26B A4B IT Thinking Uitgelicht	Gemma 4 31B IT Thinking	Gemma 4 E4B IT Thinking	Gemma 3 27B IT
Arena AI (text) Per 2 april 2026	1441	1452	-	1365
MMLU Pro Kennis & redeneren Zonder tools	82.6%	85.2%	69.4%	67.6%
MMMU Pro Multimodaal redeneren	73.8%	76.9%	52.6%	49.7%
AIME 2026 Wiskunde Zonder tools	88.3%	89.2%	42.5%	20.8%
LiveCodeBench v6 Competitief programmeren	77.1%	80.0%	52.0%	29.1%
GPQA Diamond Wetenschappelijke kennis Zonder tools	82.3%	84.3%	58.6%	42.4%
t2-bench Agentisch toolgebruik Retail	85.5%	86.4%	57.5%	6.6%

Benchmarkresultaten uit de officiële Gemma 4 modelkaart. Arena AI-scores per 2 april 2026.

MoE-architectuur

26B capaciteit, 4B inferentiekosten

Het Mixture-of-Experts ontwerp routeert elk token door 8 van de 128 experts plus 1 gedeelde expert. Alle 26B parameters blijven in het geheugen voor directe routering, maar slechts 3.8B worden geactiveerd per forward pass - wat bijna 31B-kwaliteit levert tegen een fractie van de rekenkosten.

3.8B actieve parameters per token uit 25.2B totale capaciteit
8 actieve + 1 gedeelde expert uit 128 totale experts
Proportional RoPE (p-RoPE) voor efficiënte 256K contextverwerking

Begin met Chatten Bekijk benchmarks

Geavanceerd Redeneren

88.3% op AIME 2026 - binnen 1% van het 31B model

Configureerbare denkmodus maakt transparant stapsgewijs redeneren mogelijk voor wiskunde, logica en meerstaps probleemoplossing. Het 26B MoE verkleint het verschil met het 31B dense model tot minder dan 1 procentpunt op de moeilijkste wiskundebenchmarks.

88.3% op AIME 2026 wiskunde (zonder tools)
82.3% op GPQA Diamond wetenschap op graduate-niveau
Ingebouwde redeneermodus met stapsgewijze uitleg

Probeer redeneertaken Bekijk benchmarks

Programmeerexcellentie

77.1% LiveCodeBench v6 met native function calling

Met 77.1% op LiveCodeBench v6 en 1718 Codeforces ELO blinkt Gemma 4 26B A4B uit in codegeneratie, debugging en agentische workflows. Native function calling maakt autonome agents mogelijk zonder fine-tuning.

77.1% op LiveCodeBench v6 competitieve programmeerproblemen
1718 Codeforces ELO-rating
Native function calling voor autonome agents

Test programmeertaken Integratiedocumentatie

Multimodaal Begrip

Tekst- en beeldverwerking met variabele resolutie

Verwerk tekst en afbeeldingen samen met ondersteuning voor variabele beeldverhoudingen en resoluties. 73.8% op MMMU Pro en 82.4% op MATH-Vision tonen sterk visueel redeneren en documentbegrip.