Gemma 4 E2B
De kleinste Gemma 4 - volledige multimodale intelligentie in 2,3 miljard parameters
Gemma 4 E2B bundelt tekst-, beeld- en audiobegrip in slechts 2,3 miljard effectieve parameters. Met 128K context en slechts 4 GB RAM brengt het echte AI-mogelijkheden naar telefoons, IoT-apparaten en de krapste hardwarebudgetten.
Modelvarianten
Ultracompact Instruction-Tuned model
Gemma 4 E2B gebruikt Per-Layer Embeddings (PLE) om maximale capaciteit uit minimale parameters te halen.
Per-Layer Embeddings Architectuur
2,3 miljard effectieve parameters, 5,1 miljard totaal met embeddings
Gemma 4 E2B gebruikt PLE om elk van zijn 35 decoderlagen een eigen conditioneringspad te geven. Met een ~150M vision-encoder en een ~300M audio-encoder verwerkt het tekst, beelden en audio native met minimale rekenkosten.
Het laagdrempeligste instappunt voor Gemma 4. Ideaal voor telefoons, IoT, Raspberry Pi en elke implementatie waar geheugen de belangrijkste beperking is.
Instruction-Tuned
E2B Instruct
Geoptimaliseerd voor on-device conversationele AI met audiobegrip
Fijnafgestemd voor het opvolgen van instructies met native multimodale ondersteuning
Voorgetraind
E2B Base
Basismodel voor het finetunen van ultracompacte edge-applicaties
Voorgetraind op diverse multimodale data voor maximale flexibiliteit bij minimale omvang
Mogelijkheden
Echte AI-mogelijkheden op de kleinste schaal
Gemma 4 E2B bewijst dat nuttige AI geen zware hardware vereist. Audio, beeld, redeneren en programmeren in een model dat op een telefoon past.
Native audio-invoer
De USM-achtige Conformer audio-encoder verwerkt spraak en audioclips tot 30 seconden. Spraakassistenten en audioanalyse op de kleinste apparaten.
Praktisch redeneren
60% op MMLU Pro en 37,5% op AIME 2026 wiskunde. Configureerbare denkmodus voor stapsgewijs probleemoplossen op het apparaat.
Programmeerassistentie
44% op LiveCodeBench v6 en 633 Codeforces ELO. Nuttige codegeneratie en debugging, zelfs op beperkte hardware.
128K contextvenster
Verwerking van lange documenten en uitgebreide gesprekken op het apparaat. Hybride aandacht houdt het geheugengebruik praktisch.
Beeldbegrip
44,2% op MMMU Pro. Ondersteuning voor variabele beeldverhoudingen voor documentanalyse, OCR en beeldanalyse op het apparaat.
Minimale voetafdruk
Slechts 3,2 GB VRAM bij 4-bit kwantisatie. Draait op telefoons, Raspberry Pi en budgetlaptops.
Belangrijkste highlights
Prestatiemetrieken van het ultracompacte model
Gemma 4 E2B levert betekenisvolle resultaten bij diverse taken en past op de meest beperkte hardware.
Topresultaten
- 60% op MMLU Pro kennis en redeneren
- 44% op LiveCodeBench v6 programmeren
- 43,4% op GPQA Diamond wetenschappelijke kennis
- 44,2% op MMMU Pro multimodaal redeneren
- 128K token contextvenster
Technische specificaties
- 2,3 miljard effectieve parameters (5,1 miljard met embeddings)
- 35 decoderlagen met Per-Layer Embeddings
- ~150M vision-encoder + ~300M audio-encoder
- Native tekst-, beeld-, video- en audio-invoer
- 3,2-4 GB VRAM bij 4-bit kwantisatie
Prestaties
Betekenisvolle AI op de kleinste schaal
Gemma 4 E2B behaalt 60% op MMLU Pro en 44% op LiveCodeBench v6 met slechts 2,3 miljard effectieve parameters - het bewijs dat nuttige AI in je zak past.
Gemma 4 E2B toont aan dat zelfs de kleinste modellen in de familie praktische waarde bieden bij redeneren, programmeren en multimodale taken.


60% op MMLU Pro - solide kennis en redeneren voor een ultracompact model
44% op LiveCodeBench v6 - praktische programmeerhulp op minimale hardware
43,4% op GPQA Diamond - wetenschappelijk begrip in 2,3 miljard parameters
44,2% op MMMU Pro - multimodaal redeneren op het apparaat
95 tokens/seconde op consumentenhardware - razendsnelle inferentie
Benchmarkvergelijking
E2B vs E4B en de Gemma 4-familie
Gemma 4 E2B is het kleinste model in de familie. Stap over naar E4B voor betere kwaliteit, of naar 26B/31B voor topprestaties.
| Benchmark | Gemma 4 E2B IT Thinking Uitgelicht | Gemma 4 E4B IT Thinking | Gemma 4 26B A4B IT Thinking | Gemma 4 31B IT Thinking |
|---|---|---|---|---|
MMLU Pro Kennis & redeneren | 60.0% | 69.4% | 82.6% | 85.2% |
AIME 2026 Wiskunde Zonder tools | 37.5% | 42.5% | 88.3% | 89.2% |
GPQA Diamond Wetenschappelijke kennis | 43.4% | 58.6% | 82.3% | 84.3% |
LiveCodeBench v6 Competitief programmeren | 44.0% | 52.0% | 77.1% | 80.0% |
Codeforces ELO Competitief programmeren | 633 | 940 | 1718 | 2150 |
MMMU Pro Multimodaal redeneren | 44.2% | 52.6% | 73.8% | 76.9% |
VRAM (4-bit) Minimaal geheugen | ~3.2 GB | ~5.5 GB | ~16 GB | ~17 GB |
Audio Support Native audio-invoer | Ja | Ja | Nee | Nee |
Benchmarkresultaten van de officiële Gemma 4-modelkaart. E2B-benchmarks tonen praktische capaciteit bij minimaal parameteraantal.
Ultracompact
Volledige multimodale AI in het kleinste Gemma 4-pakket
Gemma 4 E2B is geen uitgekleed model. Het heeft dezelfde multimodale architectuur als zijn grotere broers en zussen - tekst-, beeld-, video- en audio-invoer - in een pakket van 2,3 miljard effectieve parameters.
- Dezelfde modaliteiten als E4B: tekst-, beeld-, video- en audio-invoer
- Hetzelfde 128K contextvenster als het grotere edge-model
- 3,2 GB VRAM bij 4-bit - past op telefoons en budgethardware
Razend snel
95 tokens per seconde op consumentenhardware
Het kleinste model in de familie is ook het snelste. Gemma 4 E2B levert bijna directe antwoorden op consumentenhardware, ideaal voor realtime-applicaties en interactieve ervaringen.
- ~95 tokens/seconde op consumenten-GPU's
- Minder dan een seconde tot het eerste token op de meeste hardware
- Ideaal voor realtime chat, spraakassistenten en interactieve tools
IoT & Edge
AI voor apparaten die in je hand passen
Gemma 4 E2B is ontworpen voor de edge. Draai het op Pixel-telefoons, Raspberry Pi, Chrome-browsers en elk apparaat waar privacy en latentie belangrijker zijn dan benchmarkscores.
- ONNX-checkpoints voor cross-platform edge-implementatie
- WebGPU-ondersteuning voor inferentie in de browser
- Ontworpen voor Pixel-, Chrome- en IoT-omgevingen
Aan de slag
Probeer Gemma 4 E2B nu
Begin direct met chatten of download voor ultracompacte implementatie.
Download gewichten
Ultracompacte implementatie
Download officiële modelgewichten voor de kleinst mogelijke implementatie.
Edge-platformen
Implementatie op telefoon, browser en IoT
Implementeer op de kleinste apparaten met geoptimaliseerde runtimes.
Onderdeel van Gemma 4
Het kleinste model in een topfamilie
Gemma 4 E2B is het instappunt van de Gemma 4-familie. Stap over naar E4B voor betere kwaliteit, of naar 26B/31B voor topprestaties.
Aan de slag
Klaar om AI op de kleinste apparaten te draaien?
Begin gratis met chatten of download Gemma 4 E2B voor ultracompacte, privé on-device implementatie.