Gemma 4 E4B

4,5 miljard parameters aan on-device intelligentie met native audio

Gemma 4 E4B pakt 4,5 miljard effectieve parameters in een model dat draait op laptops, telefoons en browsers. Met native begrip van audio, afbeeldingen en tekst plus een contextvenster van 128K, brengt het multimodale AI van topniveau naar de edge.

Begin met chatten Bekijk benchmarks

Modelvarianten

Instructie-afgestemd voor edge-deployment

Gemma 4 E4B gebruikt Per-Layer Embeddings (PLE) om de parameterefficiëntie te maximaliseren en levert sterke prestaties vanuit een compacte architectuur.

Per-Layer Embeddings-architectuur

4,5 miljard effectieve parameters, 8 miljard totaal met embeddings

Gemma 4 E4B gebruikt PLE om elke decoderlaag een eigen conditioneringspad te geven. Met 42 lagen, een visie-encoder van ~150M en een audio-encoder van ~300M verwerkt het tekst, afbeeldingen en audio native.

Ideaal voor on-device deployment, browser-gebaseerde AI en privacygerichte toepassingen waarbij data het apparaat van de gebruiker nooit verlaat.

Begin met chatten Bekijk mogelijkheden

Instructie-afgestemd

E4B Instruct

Geoptimaliseerd voor conversationele AI, audiobegrip en on-device taakuitvoering

Afgestemd voor het opvolgen van instructies met native multimodale ondersteuning inclusief audio-invoer

Nu beschikbaar

Begin met chatten Download gewichten

Voorgetraind

E4B Base

Basismodel voor het finetunen van edge- en mobiele toepassingen

Voorgetraind op diverse multimodale data inclusief audio voor maximale flexibiliteit

Nu beschikbaar

Bekijk op HuggingFace Fine-tuning handleiding

Mogelijkheden

Desktop-niveau intelligentie op edge-hardware

Gemma 4 E4B brengt multimodaal begrip, programmeerassistentie en redenering naar apparaten die in je hand passen.

Native audio-invoer

De USM-stijl conformer audio-encoder verwerkt spraak en audioclips tot 30 seconden direct, zonder transcriptiepipeline.

Sterk redeneervermogen

Configureerbare denkmodus met 42,5% op AIME 2026 wiskunde en 58,6% op GPQA Diamond wetenschappelijke kennis op masterniveau.

Capabel programmeren

52% op LiveCodeBench v6 en 940 Codeforces ELO. Native functieaanroepen maken agentische workflows on-device mogelijk.

128K contextvenster

Verwerk lange documenten, volledige codebases en uitgebreide gesprekken on-device met hybride lokale/globale aandacht.

Visueel begrip

52,6% op MMMU Pro en 59,5% op MATH-Vision. Ondersteuning voor variabele beeldverhoudingen met configureerbare token-budgetten per afbeelding.

Draait overal

Draait in browsers via WebGPU, op telefoons via ONNX en op laptops via Ollama. Slechts 5,5 GB VRAM bij 4-bit kwantisatie.

Belangrijkste punten

Edge-prestatiemetrieken

Gemma 4 E4B levert sterke resultaten op diverse benchmarks en past op consumentenhardware.

Topresultaten

69,4% op MMLU Pro voor kennis en redenering
52% op LiveCodeBench v6 voor programmeren
58,6% op GPQA Diamond voor wetenschappelijke kennis
52,6% op MMMU Pro voor multimodaal redeneren
Contextvenster van 128K tokens

Technische specificaties

4,5 miljard effectieve parameters (8 miljard met embeddings)
42 decoderlagen met Per-Layer Embeddings
Visie-encoder van ~150M + audio-encoder van ~300M
Native invoer voor tekst, afbeeldingen, video en audio
5,5-6 GB VRAM bij 4-bit kwantisatie

Begin met chatten Bekijk modelkaart

Prestaties

Presteert ver boven zijn gewichtsklasse

Gemma 4 E4B behaalt 69,4% op MMLU Pro en 52% op LiveCodeBench v6 met slechts 4,5 miljard effectieve parameters en overtreft daarmee veel modellen van dubbele omvang.

Gemma 4 E4B toont aan dat edge-modellen betekenisvolle prestaties kunnen leveren op het gebied van redenering, programmeren en multimodale taken.

Begin met chatten Bekijk modelkaart

Prestatievergelijkingsgrafiek van Gemma 4 E4B

69,4% op MMLU Pro - sterke kennis en redenering voor een edge-model

52% op LiveCodeBench v6 - praktische programmeerassistentie on-device

58,6% op GPQA Diamond - wetenschappelijk begrip op masterniveau

52,6% op MMMU Pro - multimodaal redeneren met afbeeldingen

940 Codeforces ELO - competitief programmeervermogen

Benchmarkvergelijking

E4B versus de Gemma 4-familie en Gemma 3

Gemma 4 E4B levert sterke edge-prestaties terwijl de grotere modellen zwaardere werklasten afhandelen.

Benchmark	Gemma 4 E4B IT Thinking Uitgelicht	Gemma 4 E2B IT Thinking	Gemma 4 31B IT Thinking	Gemma 3 27B IT
MMLU Pro Kennis en redenering	69.4%	60.0%	85.2%	67.6%
AIME 2026 Wiskunde Zonder tools	42.5%	37.5%	89.2%	20.8%
GPQA Diamond Wetenschappelijke kennis	58.6%	43.4%	84.3%	42.4%
LiveCodeBench v6 Competitief programmeren	52.0%	44.0%	80.0%	29.1%
Codeforces ELO Competitief programmeren	940	633	2150	-
MMMU Pro Multimodaal redeneren	52.6%	44.2%	76.9%	49.7%
MATH-Vision Visueel wiskundig redeneren	59.5%	52.4%	85.6%	-
Audio Support Native audio-invoer	Ja	Ja	Nee	Nee
Context Window Maximale tokens	128K	128K	256K	128K

Benchmarkresultaten van de officiële Gemma 4-modelkaart. E4B-benchmarks tonen uitzonderlijke efficiëntie voor het aantal parameters.

Native audio

Spraakbegrip zonder transcriptiepipeline

Gemma 4 E4B bevat een USM-stijl conformer audio-encoder die spraak en audio direct verwerkt. Geen apart ASR-model nodig - voer gewoon audio in en ontvang intelligente antwoorden.

Conformer audio-encoder van ~300M parameters ingebouwd in het model
Verwerkt audioclips tot 30 seconden direct
Ideaal voor spraakassistenten, audio-analyse en toegankelijkheidstools

Probeer audio-invoer Bekijk documentatie

Spraakbegrip zonder transcriptiepipeline

Edge-deployment

Van browser tot telefoon tot Raspberry Pi

Gemma 4 E4B is ontworpen voor deployment overal. Draai het in Chrome met WebGPU via transformers.js, op telefoons met ONNX of op laptops met Ollama. Slechts 5,5 GB VRAM bij 4-bit kwantisatie.

Browser: transformers.js met WebGPU-versnelling in Chrome
Mobiel: ONNX-checkpoints voor iOS- en Android-deployment
Lokaal: Ollama, llama.cpp, MLX voor privé on-device inferentie

Probeer in de browser Download voor lokaal gebruik

Van browser tot telefoon tot Raspberry Pi

Visie en documenten

Beeldbegrip en documentanalyse on-device

De visie-encoder van ~150M verwerkt afbeeldingen met variabele beeldverhoudingen en configureerbare token-budgetten. Sterke OCR en documentbegrip maken het praktisch voor on-device documentanalyse.

52,6% op MMMU Pro voor multimodaal redeneren
Variabele beeldresolutie: 70 tot 1120 tokens per afbeelding
Documentanalyse, OCR, grafiekbegrip on-device

Probeer visietaken Bekijk voorbeelden

Beeldbegrip en documentanalyse on-device

Aan de slag

Probeer Gemma 4 E4B nu

Begin direct met chatten of download het model voor on-device deployment.

Begin met chatten

Chat direct met Gemma 4 E4B, geen installatie nodig

Bekijk het overzicht

Officiële introductievideo van Gemma 4

Modelkaart

Volledige technische specificaties en benchmarks

Documentatie

Integratiehandleidingen en best practices

Download gewichten

On-device deployment

Download officiële modelgewichten voor edge- en lokale deployment.

Hugging Face

Officiële Gemma 4 E4B-modelrepository

Kaggle

Download van Kaggle Models

Ollama

Draai lokaal met Ollama

Edge-platformen

Browser- en mobiele deployment

Deploy op edge-apparaten, browsers en mobiele platformen.

transformers.js

Draai in browsers met WebGPU-versnelling

ONNX Runtime

Cross-platform edge-deployment

MLX

Geoptimaliseerd voor Apple Silicon

llama.cpp

Efficiënte CPU- en GPU-inferentie

Onderdeel van Gemma 4

Het edge-model in een topfamilie

Gemma 4 E4B is het aanbevolen edge-model in de Gemma 4-familie. Stap over naar 26B MoE of 31B Dense wanneer je meer kracht nodig hebt, of naar E2B voor de kleinste footprint.

Ontdek alle modellen Officiële pagina

Gemma 4 E2B

Ultracompact 2,3 miljard model voor de strengste hardwarebeperkingen

Vergelijk

Gemma 4 26B

MoE-model met bijna 31B-kwaliteit tegen 4B inferentiekosten

Meer informatie

Gemma 4 31B

Vlaggenschip dicht model voor maximale prestaties

Meer informatie

Documentatie

Volledige handleidingen voor integratie en deployment

Lees documentatie

Community

Sluit je aan bij ontwikkelaars die bouwen met Gemma

Ontdek

Modelkaart

Technische specificaties en evaluatieresultaten

Bekijk details

Aan de slag

Klaar om AI on-device te draaien met Gemma 4 E4B?

Begin gratis met chatten of download het model voor privé on-device deployment. Geen data verlaat je apparaat.

Begin gratis met chatten Download gewichten

4,5 miljard parameters aan on-device intelligentie met native audio

Multimodale intelligentie die in je zak past

Instructie-afgestemd voor edge-deployment

4,5 miljard effectieve parameters, 8 miljard totaal met embeddings

E4B Instruct

E4B Base

Desktop-niveau intelligentie op edge-hardware

Native audio-invoer

Sterk redeneervermogen

Capabel programmeren

128K contextvenster

Visueel begrip

Draait overal

Edge-prestatiemetrieken

Presteert ver boven zijn gewichtsklasse

E4B versus de Gemma 4-familie en Gemma 3

Spraakbegrip zonder transcriptiepipeline

Van browser tot telefoon tot Raspberry Pi

Beeldbegrip en documentanalyse on-device

Probeer Gemma 4 E4B nu

On-device deployment

Browser- en mobiele deployment

Het edge-model in een topfamilie

Gemma 4 E2B

Gemma 4 26B

Gemma 4 31B

Documentatie

Community

Modelkaart

Klaar om AI on-device te draaien met Gemma 4 E4B?