Gemma 4 E2B

De kleinste Gemma 4 - volledige multimodale intelligentie in 2,3 miljard parameters

Gemma 4 E2B bundelt tekst-, beeld- en audiobegrip in slechts 2,3 miljard effectieve parameters. Met 128K context en slechts 4 GB RAM brengt het echte AI-mogelijkheden naar telefoons, IoT-apparaten en de krapste hardwarebudgetten.

Modelvarianten

Ultracompact Instruction-Tuned model

Gemma 4 E2B gebruikt Per-Layer Embeddings (PLE) om maximale capaciteit uit minimale parameters te halen.

Per-Layer Embeddings Architectuur

2,3 miljard effectieve parameters, 5,1 miljard totaal met embeddings

Gemma 4 E2B gebruikt PLE om elk van zijn 35 decoderlagen een eigen conditioneringspad te geven. Met een ~150M vision-encoder en een ~300M audio-encoder verwerkt het tekst, beelden en audio native met minimale rekenkosten.

Het laagdrempeligste instappunt voor Gemma 4. Ideaal voor telefoons, IoT, Raspberry Pi en elke implementatie waar geheugen de belangrijkste beperking is.

Instruction-Tuned

E2B Instruct

Geoptimaliseerd voor on-device conversationele AI met audiobegrip

Fijnafgestemd voor het opvolgen van instructies met native multimodale ondersteuning

Nu beschikbaar

Voorgetraind

E2B Base

Basismodel voor het finetunen van ultracompacte edge-applicaties

Voorgetraind op diverse multimodale data voor maximale flexibiliteit bij minimale omvang

Nu beschikbaar

Mogelijkheden

Echte AI-mogelijkheden op de kleinste schaal

Gemma 4 E2B bewijst dat nuttige AI geen zware hardware vereist. Audio, beeld, redeneren en programmeren in een model dat op een telefoon past.

Native audio-invoer

De USM-achtige Conformer audio-encoder verwerkt spraak en audioclips tot 30 seconden. Spraakassistenten en audioanalyse op de kleinste apparaten.

Praktisch redeneren

60% op MMLU Pro en 37,5% op AIME 2026 wiskunde. Configureerbare denkmodus voor stapsgewijs probleemoplossen op het apparaat.

Programmeerassistentie

44% op LiveCodeBench v6 en 633 Codeforces ELO. Nuttige codegeneratie en debugging, zelfs op beperkte hardware.

128K contextvenster

Verwerking van lange documenten en uitgebreide gesprekken op het apparaat. Hybride aandacht houdt het geheugengebruik praktisch.

Beeldbegrip

44,2% op MMMU Pro. Ondersteuning voor variabele beeldverhoudingen voor documentanalyse, OCR en beeldanalyse op het apparaat.

Minimale voetafdruk

Slechts 3,2 GB VRAM bij 4-bit kwantisatie. Draait op telefoons, Raspberry Pi en budgetlaptops.

Belangrijkste highlights

Prestatiemetrieken van het ultracompacte model

Gemma 4 E2B levert betekenisvolle resultaten bij diverse taken en past op de meest beperkte hardware.

Topresultaten

  • 60% op MMLU Pro kennis en redeneren
  • 44% op LiveCodeBench v6 programmeren
  • 43,4% op GPQA Diamond wetenschappelijke kennis
  • 44,2% op MMMU Pro multimodaal redeneren
  • 128K token contextvenster

Technische specificaties

  • 2,3 miljard effectieve parameters (5,1 miljard met embeddings)
  • 35 decoderlagen met Per-Layer Embeddings
  • ~150M vision-encoder + ~300M audio-encoder
  • Native tekst-, beeld-, video- en audio-invoer
  • 3,2-4 GB VRAM bij 4-bit kwantisatie

Prestaties

Betekenisvolle AI op de kleinste schaal

Gemma 4 E2B behaalt 60% op MMLU Pro en 44% op LiveCodeBench v6 met slechts 2,3 miljard effectieve parameters - het bewijs dat nuttige AI in je zak past.

Gemma 4 E2B toont aan dat zelfs de kleinste modellen in de familie praktische waarde bieden bij redeneren, programmeren en multimodale taken.

Gemma 4 E2B prestatievergelijkingsgrafiek

60% op MMLU Pro - solide kennis en redeneren voor een ultracompact model

44% op LiveCodeBench v6 - praktische programmeerhulp op minimale hardware

43,4% op GPQA Diamond - wetenschappelijk begrip in 2,3 miljard parameters

44,2% op MMMU Pro - multimodaal redeneren op het apparaat

95 tokens/seconde op consumentenhardware - razendsnelle inferentie

Benchmarkvergelijking

E2B vs E4B en de Gemma 4-familie

Gemma 4 E2B is het kleinste model in de familie. Stap over naar E4B voor betere kwaliteit, of naar 26B/31B voor topprestaties.

Benchmark
Gemma 4 E2B IT
Thinking
Uitgelicht
Gemma 4 E4B IT
Thinking
Gemma 4 26B A4B IT
Thinking
Gemma 4 31B IT
Thinking
MMLU Pro
Kennis & redeneren
60.0%69.4%82.6%85.2%
AIME 2026
Wiskunde
Zonder tools
37.5%42.5%88.3%89.2%
GPQA Diamond
Wetenschappelijke kennis
43.4%58.6%82.3%84.3%
LiveCodeBench v6
Competitief programmeren
44.0%52.0%77.1%80.0%
Codeforces ELO
Competitief programmeren
63394017182150
MMMU Pro
Multimodaal redeneren
44.2%52.6%73.8%76.9%
VRAM (4-bit)
Minimaal geheugen
~3.2 GB~5.5 GB~16 GB~17 GB
Audio Support
Native audio-invoer
JaJaNeeNee

Benchmarkresultaten van de officiële Gemma 4-modelkaart. E2B-benchmarks tonen praktische capaciteit bij minimaal parameteraantal.

Ultracompact

Volledige multimodale AI in het kleinste Gemma 4-pakket

Gemma 4 E2B is geen uitgekleed model. Het heeft dezelfde multimodale architectuur als zijn grotere broers en zussen - tekst-, beeld-, video- en audio-invoer - in een pakket van 2,3 miljard effectieve parameters.

  • Dezelfde modaliteiten als E4B: tekst-, beeld-, video- en audio-invoer
  • Hetzelfde 128K contextvenster als het grotere edge-model
  • 3,2 GB VRAM bij 4-bit - past op telefoons en budgethardware
Volledige multimodale AI in het kleinste Gemma 4-pakket

Razend snel

95 tokens per seconde op consumentenhardware

Het kleinste model in de familie is ook het snelste. Gemma 4 E2B levert bijna directe antwoorden op consumentenhardware, ideaal voor realtime-applicaties en interactieve ervaringen.

  • ~95 tokens/seconde op consumenten-GPU's
  • Minder dan een seconde tot het eerste token op de meeste hardware
  • Ideaal voor realtime chat, spraakassistenten en interactieve tools
95 tokens per seconde op consumentenhardware

IoT & Edge

AI voor apparaten die in je hand passen

Gemma 4 E2B is ontworpen voor de edge. Draai het op Pixel-telefoons, Raspberry Pi, Chrome-browsers en elk apparaat waar privacy en latentie belangrijker zijn dan benchmarkscores.

  • ONNX-checkpoints voor cross-platform edge-implementatie
  • WebGPU-ondersteuning voor inferentie in de browser
  • Ontworpen voor Pixel-, Chrome- en IoT-omgevingen
AI voor apparaten die in je hand passen

Onderdeel van Gemma 4

Het kleinste model in een topfamilie

Gemma 4 E2B is het instappunt van de Gemma 4-familie. Stap over naar E4B voor betere kwaliteit, of naar 26B/31B voor topprestaties.

Gemma 4 E4B

Krachtiger edge-model met 4,5 miljard effectieve parameters

Vergelijken

Gemma 4 26B

MoE-model met bijna 31B-kwaliteit tegen 4B inferentiekosten

Meer informatie

Gemma 4 31B

Vlaggenschip dense model voor maximale prestaties

Meer informatie

Documentatie

Volledige handleidingen voor integratie en implementatie

Lees docs

Community

Sluit je aan bij ontwikkelaars die bouwen met Gemma

Ontdekken

Modelkaart

Technische specificaties en evaluatieresultaten

Bekijk details

Aan de slag

Klaar om AI op de kleinste apparaten te draaien?

Begin gratis met chatten of download Gemma 4 E2B voor ultracompacte, privé on-device implementatie.