Gemma 4 E4B
4,5 miljard parameters aan on-device intelligentie met native audio
Gemma 4 E4B pakt 4,5 miljard effectieve parameters in een model dat draait op laptops, telefoons en browsers. Met native begrip van audio, afbeeldingen en tekst plus een contextvenster van 128K, brengt het multimodale AI van topniveau naar de edge.
Modelvarianten
Instructie-afgestemd voor edge-deployment
Gemma 4 E4B gebruikt Per-Layer Embeddings (PLE) om de parameterefficiëntie te maximaliseren en levert sterke prestaties vanuit een compacte architectuur.
Per-Layer Embeddings-architectuur
4,5 miljard effectieve parameters, 8 miljard totaal met embeddings
Gemma 4 E4B gebruikt PLE om elke decoderlaag een eigen conditioneringspad te geven. Met 42 lagen, een visie-encoder van ~150M en een audio-encoder van ~300M verwerkt het tekst, afbeeldingen en audio native.
Ideaal voor on-device deployment, browser-gebaseerde AI en privacygerichte toepassingen waarbij data het apparaat van de gebruiker nooit verlaat.
Instructie-afgestemd
E4B Instruct
Geoptimaliseerd voor conversationele AI, audiobegrip en on-device taakuitvoering
Afgestemd voor het opvolgen van instructies met native multimodale ondersteuning inclusief audio-invoer
Voorgetraind
E4B Base
Basismodel voor het finetunen van edge- en mobiele toepassingen
Voorgetraind op diverse multimodale data inclusief audio voor maximale flexibiliteit
Mogelijkheden
Desktop-niveau intelligentie op edge-hardware
Gemma 4 E4B brengt multimodaal begrip, programmeerassistentie en redenering naar apparaten die in je hand passen.
Native audio-invoer
De USM-stijl conformer audio-encoder verwerkt spraak en audioclips tot 30 seconden direct, zonder transcriptiepipeline.
Sterk redeneervermogen
Configureerbare denkmodus met 42,5% op AIME 2026 wiskunde en 58,6% op GPQA Diamond wetenschappelijke kennis op masterniveau.
Capabel programmeren
52% op LiveCodeBench v6 en 940 Codeforces ELO. Native functieaanroepen maken agentische workflows on-device mogelijk.
128K contextvenster
Verwerk lange documenten, volledige codebases en uitgebreide gesprekken on-device met hybride lokale/globale aandacht.
Visueel begrip
52,6% op MMMU Pro en 59,5% op MATH-Vision. Ondersteuning voor variabele beeldverhoudingen met configureerbare token-budgetten per afbeelding.
Draait overal
Draait in browsers via WebGPU, op telefoons via ONNX en op laptops via Ollama. Slechts 5,5 GB VRAM bij 4-bit kwantisatie.
Belangrijkste punten
Edge-prestatiemetrieken
Gemma 4 E4B levert sterke resultaten op diverse benchmarks en past op consumentenhardware.
Topresultaten
- 69,4% op MMLU Pro voor kennis en redenering
- 52% op LiveCodeBench v6 voor programmeren
- 58,6% op GPQA Diamond voor wetenschappelijke kennis
- 52,6% op MMMU Pro voor multimodaal redeneren
- Contextvenster van 128K tokens
Technische specificaties
- 4,5 miljard effectieve parameters (8 miljard met embeddings)
- 42 decoderlagen met Per-Layer Embeddings
- Visie-encoder van ~150M + audio-encoder van ~300M
- Native invoer voor tekst, afbeeldingen, video en audio
- 5,5-6 GB VRAM bij 4-bit kwantisatie
Prestaties
Presteert ver boven zijn gewichtsklasse
Gemma 4 E4B behaalt 69,4% op MMLU Pro en 52% op LiveCodeBench v6 met slechts 4,5 miljard effectieve parameters en overtreft daarmee veel modellen van dubbele omvang.
Gemma 4 E4B toont aan dat edge-modellen betekenisvolle prestaties kunnen leveren op het gebied van redenering, programmeren en multimodale taken.


69,4% op MMLU Pro - sterke kennis en redenering voor een edge-model
52% op LiveCodeBench v6 - praktische programmeerassistentie on-device
58,6% op GPQA Diamond - wetenschappelijk begrip op masterniveau
52,6% op MMMU Pro - multimodaal redeneren met afbeeldingen
940 Codeforces ELO - competitief programmeervermogen
Benchmarkvergelijking
E4B versus de Gemma 4-familie en Gemma 3
Gemma 4 E4B levert sterke edge-prestaties terwijl de grotere modellen zwaardere werklasten afhandelen.
| Benchmark | Gemma 4 E4B IT Thinking Uitgelicht | Gemma 4 E2B IT Thinking | Gemma 4 31B IT Thinking | Gemma 3 27B IT |
|---|---|---|---|---|
MMLU Pro Kennis en redenering | 69.4% | 60.0% | 85.2% | 67.6% |
AIME 2026 Wiskunde Zonder tools | 42.5% | 37.5% | 89.2% | 20.8% |
GPQA Diamond Wetenschappelijke kennis | 58.6% | 43.4% | 84.3% | 42.4% |
LiveCodeBench v6 Competitief programmeren | 52.0% | 44.0% | 80.0% | 29.1% |
Codeforces ELO Competitief programmeren | 940 | 633 | 2150 | - |
MMMU Pro Multimodaal redeneren | 52.6% | 44.2% | 76.9% | 49.7% |
MATH-Vision Visueel wiskundig redeneren | 59.5% | 52.4% | 85.6% | - |
Audio Support Native audio-invoer | Ja | Ja | Nee | Nee |
Context Window Maximale tokens | 128K | 128K | 256K | 128K |
Benchmarkresultaten van de officiële Gemma 4-modelkaart. E4B-benchmarks tonen uitzonderlijke efficiëntie voor het aantal parameters.
Native audio
Spraakbegrip zonder transcriptiepipeline
Gemma 4 E4B bevat een USM-stijl conformer audio-encoder die spraak en audio direct verwerkt. Geen apart ASR-model nodig - voer gewoon audio in en ontvang intelligente antwoorden.
- Conformer audio-encoder van ~300M parameters ingebouwd in het model
- Verwerkt audioclips tot 30 seconden direct
- Ideaal voor spraakassistenten, audio-analyse en toegankelijkheidstools
Edge-deployment
Van browser tot telefoon tot Raspberry Pi
Gemma 4 E4B is ontworpen voor deployment overal. Draai het in Chrome met WebGPU via transformers.js, op telefoons met ONNX of op laptops met Ollama. Slechts 5,5 GB VRAM bij 4-bit kwantisatie.
- Browser: transformers.js met WebGPU-versnelling in Chrome
- Mobiel: ONNX-checkpoints voor iOS- en Android-deployment
- Lokaal: Ollama, llama.cpp, MLX voor privé on-device inferentie
Visie en documenten
Beeldbegrip en documentanalyse on-device
De visie-encoder van ~150M verwerkt afbeeldingen met variabele beeldverhoudingen en configureerbare token-budgetten. Sterke OCR en documentbegrip maken het praktisch voor on-device documentanalyse.
- 52,6% op MMMU Pro voor multimodaal redeneren
- Variabele beeldresolutie: 70 tot 1120 tokens per afbeelding
- Documentanalyse, OCR, grafiekbegrip on-device
Aan de slag
Probeer Gemma 4 E4B nu
Begin direct met chatten of download het model voor on-device deployment.
Download gewichten
On-device deployment
Download officiële modelgewichten voor edge- en lokale deployment.
Edge-platformen
Browser- en mobiele deployment
Deploy op edge-apparaten, browsers en mobiele platformen.
Onderdeel van Gemma 4
Het edge-model in een topfamilie
Gemma 4 E4B is het aanbevolen edge-model in de Gemma 4-familie. Stap over naar 26B MoE of 31B Dense wanneer je meer kracht nodig hebt, of naar E2B voor de kleinste footprint.
Aan de slag
Klaar om AI on-device te draaien met Gemma 4 E4B?
Begin gratis met chatten of download het model voor privé on-device deployment. Geen data verlaat je apparaat.