Gemma 4 26B A4B

26 miljard parameters, 4 miljard actief - frontier-intelligentie op inferentiesnelheid

Gemma 4 26B A4B is een Mixture-of-Experts model dat slechts 4B parameters per token activeert en toch bijna 31B-kwaliteit levert. Met 256K context, meer dan 140 talen en 88.3% op AIME 2026 is het de meest efficiënte weg naar frontier-klasse redeneren.

Modelvarianten

Instruction-tuned en basismodellen

Kies tussen de instruction-tuned variant, geoptimaliseerd voor chat en taakvoltooiing, of het basismodel voor fine-tuning en gespecialiseerde toepassingen.

Mixture-of-Experts Architectuur

25.2B totale parameters, 3.8B actief per token

Gemma 4 26B A4B gebruikt een sparse MoE-ontwerp met 8 actieve experts uit 128 totaal, plus 1 gedeelde expert. Alle 26B parameters blijven in het geheugen voor snelle routering, maar de inferentiekosten blijven vergelijkbaar met een 4B dense model.

Ideaal voor high-throughput productie-implementaties waar u bijna 31B-kwaliteit nodig hebt tegen een fractie van de rekenkosten.

Instruction-tuned

26B Instruct

Geoptimaliseerd voor conversationele AI en complexe taakvoltooiing

Verfijnd met RLHF voor het opvolgen van instructies en meervoudige dialoog

Nu beschikbaar

Voorgetraind

26B Base

Basis MoE-model voor fine-tuning en gespecialiseerde toepassingen

Voorgetraind op diverse multimodale data met sparse expert-routering

Nu beschikbaar

Mogelijkheden

Frontier-niveau prestaties tegen 4B inferentiekosten

Gemma 4 26B A4B combineert MoE-efficiëntie met geavanceerd redeneren, uitzonderlijk programmeren en multimodaal begrip - en levert bijna 31B-kwaliteit tegen een fractie van de rekenkosten.

MoE-efficiëntie

Activeert slechts 3.8B parameters per token uit een pool van 25.2B. Bijna 31B-kwaliteit tegen ~4B inferentiekosten - de beste efficiëntieverhouding in de Gemma 4-familie.

Geavanceerd redeneren

Configureerbare denkmodus maakt stapsgewijs redeneren mogelijk. Behaalt 88.3% op AIME 2026 wiskunde - slechts 0.9 punt achter het 31B dense model.

Uitzonderlijk programmeren

77.1% op LiveCodeBench v6 en 1718 Codeforces ELO. Native function calling voor agentische workflows en autonome code-uitvoering.

256K contextvenster

Uitgebreide context voor volledige codebases, lange documenten en meervoudige gesprekken. Hybride lokale/globale attention voor geheugenefficiëntie.

Multimodaal begrip

Verwerkt tekst en afbeeldingen met variabele beeldverhoudingen. 73.8% op MMMU Pro en 82.4% op MATH-Vision voor visueel redeneren.

Meer dan 140 talen

Meertalige ondersteuning met cultureel contextbegrip. 82.6% op MMLU Pro over diverse kennisdomeinen.

Belangrijkste hoogtepunten

Uitzonderlijke prestatiemetrieken

Gemma 4 26B A4B behaalt bijna 31B-resultaten over diverse benchmarks terwijl slechts 3.8B parameters per token worden geactiveerd.

Topprestaties

  • Arena AI ELO 1441 - concurrerend met het 31B dense model
  • 88.3% op AIME 2026 wiskunde (zonder tools)
  • 77.1% op LiveCodeBench v6 programmeren
  • 82.3% op GPQA Diamond wetenschappelijke kennis
  • 85.5% op t2-bench agentisch toolgebruik

Technische specificaties

  • 25.2B totale parameters, 3.8B actief per token
  • 8 actieve + 1 gedeelde expert uit 128 totaal
  • 256K token contextvenster
  • Ondersteuning voor meer dan 140 talen
  • Hybride lokaal/globaal attention-mechanisme

Prestaties

Bijna 31B-kwaliteit tegen 4B inferentiekosten

Gemma 4 26B A4B behaalt 88.3% op AIME 2026 en 82.6% op MMLU Pro - binnen 1% van het 31B dense model - terwijl slechts 3.8B parameters per token worden geactiveerd.

Gemma 4 26B A4B toont consistente excellentie over redeneer-, programmeer-, multimodale en agentische benchmarks - binnen 1-3% van het 31B dense model op elke taak.

Gemma 4 26B A4B prestatievergelijkingsgrafiek

Arena AI ELO 1441 - concurrerend met het 31B dense model

88.3% op AIME 2026 wiskunde (zonder tools)

77.1% op LiveCodeBench v6 competitief programmeren

82.3% op GPQA Diamond wetenschappelijke kennis

85.5% op t2-bench agentisch toolgebruik

Benchmarkvergelijking

26B MoE vs 31B Dense en de Gemma 4-familie

Gemma 4 26B A4B levert bijna 31B-prestaties over redeneer-, programmeer-, multimodale en agentische taken tegen een fractie van de inferentiekosten.

Benchmark
Gemma 4 26B A4B IT
Thinking
Uitgelicht
Gemma 4 31B IT
Thinking
Gemma 4 E4B IT
Thinking
Gemma 3 27B IT
Arena AI (text)
Per 2 april 2026
14411452-1365
MMLU Pro
Kennis & redeneren
Zonder tools
82.6%85.2%69.4%67.6%
MMMU Pro
Multimodaal redeneren
73.8%76.9%52.6%49.7%
AIME 2026
Wiskunde
Zonder tools
88.3%89.2%42.5%20.8%
LiveCodeBench v6
Competitief programmeren
77.1%80.0%52.0%29.1%
GPQA Diamond
Wetenschappelijke kennis
Zonder tools
82.3%84.3%58.6%42.4%
t2-bench
Agentisch toolgebruik
Retail
85.5%86.4%57.5%6.6%

Benchmarkresultaten uit de officiële Gemma 4 modelkaart. Arena AI-scores per 2 april 2026.

MoE-architectuur

26B capaciteit, 4B inferentiekosten

Het Mixture-of-Experts ontwerp routeert elk token door 8 van de 128 experts plus 1 gedeelde expert. Alle 26B parameters blijven in het geheugen voor directe routering, maar slechts 3.8B worden geactiveerd per forward pass - wat bijna 31B-kwaliteit levert tegen een fractie van de rekenkosten.

  • 3.8B actieve parameters per token uit 25.2B totale capaciteit
  • 8 actieve + 1 gedeelde expert uit 128 totale experts
  • Proportional RoPE (p-RoPE) voor efficiënte 256K contextverwerking
Gemma 4 26B A4B MoE architecture

Geavanceerd Redeneren

88.3% op AIME 2026 - binnen 1% van het 31B model

Configureerbare denkmodus maakt transparant stapsgewijs redeneren mogelijk voor wiskunde, logica en meerstaps probleemoplossing. Het 26B MoE verkleint het verschil met het 31B dense model tot minder dan 1 procentpunt op de moeilijkste wiskundebenchmarks.

  • 88.3% op AIME 2026 wiskunde (zonder tools)
  • 82.3% op GPQA Diamond wetenschap op graduate-niveau
  • Ingebouwde redeneermodus met stapsgewijze uitleg
Gemma 4 26B A4B advanced reasoning

Programmeerexcellentie

77.1% LiveCodeBench v6 met native function calling

Met 77.1% op LiveCodeBench v6 en 1718 Codeforces ELO blinkt Gemma 4 26B A4B uit in codegeneratie, debugging en agentische workflows. Native function calling maakt autonome agents mogelijk zonder fine-tuning.

  • 77.1% op LiveCodeBench v6 competitieve programmeerproblemen
  • 1718 Codeforces ELO-rating
  • Native function calling voor autonome agents
Gemma 4 26B A4B coding excellence

Multimodaal Begrip

Tekst- en beeldverwerking met variabele resolutie

Verwerk tekst en afbeeldingen samen met ondersteuning voor variabele beeldverhoudingen en resoluties. 73.8% op MMMU Pro en 82.4% op MATH-Vision tonen sterk visueel redeneren en documentbegrip.

  • 73.8% op MMMU Pro multimodaal redeneren
  • 82.4% op MATH-Vision visuele wiskundeproblemen
  • Ondersteuning voor variabele beeldresolutie (70-1120 tokens)
Gemma 4 26B A4B multimodal understanding

Gewichten downloaden

Zelf-gehoste implementatie

Download officiële modelgewichten voor implementatie op uw eigen infrastructuur.

Implementeren en schalen

Productie-implementatieopties

Enterprise-ready implementatie op Google Cloud, Kubernetes of uw eigen infrastructuur.

Ontdek de Gemmaverse

Onderdeel van het bredere Gemma-ecosysteem

Gemma 4 26B A4B maakt deel uit van Google's open modelfamilie, met uitgebreide community-ondersteuning, integraties en bronnen.

Documentatie

Volledige handleidingen voor integratie en implementatie

Lees documentatie

Veiligheid & Verantwoordelijkheid

Ethische AI-ontwikkeling en veiligheidsrichtlijnen

Meer informatie

Modelkaart

Technische specificaties en evaluatieresultaten

Bekijk details

GitHub Repository

Broncode, voorbeelden en community-bijdragen

Bekijk code

HuggingFace

Download gewichten en verken de model hub

Downloaden

Cloud-implementatie

Enterprise-implementatie op Google Cloud

Implementeren

Aan de slag

Klaar om te bouwen met Gemma 4 26B A4B?

Begin direct gratis met chatten, of download het model voor zelf-gehoste implementatie op uw eigen infrastructuur.