Gemma 4 E4B

4,5 miljard parameters aan on-device intelligentie met native audio

Gemma 4 E4B pakt 4,5 miljard effectieve parameters in een model dat draait op laptops, telefoons en browsers. Met native begrip van audio, afbeeldingen en tekst plus een contextvenster van 128K, brengt het multimodale AI van topniveau naar de edge.

Modelvarianten

Instructie-afgestemd voor edge-deployment

Gemma 4 E4B gebruikt Per-Layer Embeddings (PLE) om de parameterefficiëntie te maximaliseren en levert sterke prestaties vanuit een compacte architectuur.

Per-Layer Embeddings-architectuur

4,5 miljard effectieve parameters, 8 miljard totaal met embeddings

Gemma 4 E4B gebruikt PLE om elke decoderlaag een eigen conditioneringspad te geven. Met 42 lagen, een visie-encoder van ~150M en een audio-encoder van ~300M verwerkt het tekst, afbeeldingen en audio native.

Ideaal voor on-device deployment, browser-gebaseerde AI en privacygerichte toepassingen waarbij data het apparaat van de gebruiker nooit verlaat.

Instructie-afgestemd

E4B Instruct

Geoptimaliseerd voor conversationele AI, audiobegrip en on-device taakuitvoering

Afgestemd voor het opvolgen van instructies met native multimodale ondersteuning inclusief audio-invoer

Nu beschikbaar

Voorgetraind

E4B Base

Basismodel voor het finetunen van edge- en mobiele toepassingen

Voorgetraind op diverse multimodale data inclusief audio voor maximale flexibiliteit

Nu beschikbaar

Mogelijkheden

Desktop-niveau intelligentie op edge-hardware

Gemma 4 E4B brengt multimodaal begrip, programmeerassistentie en redenering naar apparaten die in je hand passen.

Native audio-invoer

De USM-stijl conformer audio-encoder verwerkt spraak en audioclips tot 30 seconden direct, zonder transcriptiepipeline.

Sterk redeneervermogen

Configureerbare denkmodus met 42,5% op AIME 2026 wiskunde en 58,6% op GPQA Diamond wetenschappelijke kennis op masterniveau.

Capabel programmeren

52% op LiveCodeBench v6 en 940 Codeforces ELO. Native functieaanroepen maken agentische workflows on-device mogelijk.

128K contextvenster

Verwerk lange documenten, volledige codebases en uitgebreide gesprekken on-device met hybride lokale/globale aandacht.

Visueel begrip

52,6% op MMMU Pro en 59,5% op MATH-Vision. Ondersteuning voor variabele beeldverhoudingen met configureerbare token-budgetten per afbeelding.

Draait overal

Draait in browsers via WebGPU, op telefoons via ONNX en op laptops via Ollama. Slechts 5,5 GB VRAM bij 4-bit kwantisatie.

Belangrijkste punten

Edge-prestatiemetrieken

Gemma 4 E4B levert sterke resultaten op diverse benchmarks en past op consumentenhardware.

Topresultaten

  • 69,4% op MMLU Pro voor kennis en redenering
  • 52% op LiveCodeBench v6 voor programmeren
  • 58,6% op GPQA Diamond voor wetenschappelijke kennis
  • 52,6% op MMMU Pro voor multimodaal redeneren
  • Contextvenster van 128K tokens

Technische specificaties

  • 4,5 miljard effectieve parameters (8 miljard met embeddings)
  • 42 decoderlagen met Per-Layer Embeddings
  • Visie-encoder van ~150M + audio-encoder van ~300M
  • Native invoer voor tekst, afbeeldingen, video en audio
  • 5,5-6 GB VRAM bij 4-bit kwantisatie

Prestaties

Presteert ver boven zijn gewichtsklasse

Gemma 4 E4B behaalt 69,4% op MMLU Pro en 52% op LiveCodeBench v6 met slechts 4,5 miljard effectieve parameters en overtreft daarmee veel modellen van dubbele omvang.

Gemma 4 E4B toont aan dat edge-modellen betekenisvolle prestaties kunnen leveren op het gebied van redenering, programmeren en multimodale taken.

Prestatievergelijkingsgrafiek van Gemma 4 E4B

69,4% op MMLU Pro - sterke kennis en redenering voor een edge-model

52% op LiveCodeBench v6 - praktische programmeerassistentie on-device

58,6% op GPQA Diamond - wetenschappelijk begrip op masterniveau

52,6% op MMMU Pro - multimodaal redeneren met afbeeldingen

940 Codeforces ELO - competitief programmeervermogen

Benchmarkvergelijking

E4B versus de Gemma 4-familie en Gemma 3

Gemma 4 E4B levert sterke edge-prestaties terwijl de grotere modellen zwaardere werklasten afhandelen.

Benchmark
Gemma 4 E4B IT
Thinking
Uitgelicht
Gemma 4 E2B IT
Thinking
Gemma 4 31B IT
Thinking
Gemma 3 27B IT
MMLU Pro
Kennis en redenering
69.4%60.0%85.2%67.6%
AIME 2026
Wiskunde
Zonder tools
42.5%37.5%89.2%20.8%
GPQA Diamond
Wetenschappelijke kennis
58.6%43.4%84.3%42.4%
LiveCodeBench v6
Competitief programmeren
52.0%44.0%80.0%29.1%
Codeforces ELO
Competitief programmeren
9406332150-
MMMU Pro
Multimodaal redeneren
52.6%44.2%76.9%49.7%
MATH-Vision
Visueel wiskundig redeneren
59.5%52.4%85.6%-
Audio Support
Native audio-invoer
JaJaNeeNee
Context Window
Maximale tokens
128K128K256K128K

Benchmarkresultaten van de officiële Gemma 4-modelkaart. E4B-benchmarks tonen uitzonderlijke efficiëntie voor het aantal parameters.

Native audio

Spraakbegrip zonder transcriptiepipeline

Gemma 4 E4B bevat een USM-stijl conformer audio-encoder die spraak en audio direct verwerkt. Geen apart ASR-model nodig - voer gewoon audio in en ontvang intelligente antwoorden.

  • Conformer audio-encoder van ~300M parameters ingebouwd in het model
  • Verwerkt audioclips tot 30 seconden direct
  • Ideaal voor spraakassistenten, audio-analyse en toegankelijkheidstools
Spraakbegrip zonder transcriptiepipeline

Edge-deployment

Van browser tot telefoon tot Raspberry Pi

Gemma 4 E4B is ontworpen voor deployment overal. Draai het in Chrome met WebGPU via transformers.js, op telefoons met ONNX of op laptops met Ollama. Slechts 5,5 GB VRAM bij 4-bit kwantisatie.

  • Browser: transformers.js met WebGPU-versnelling in Chrome
  • Mobiel: ONNX-checkpoints voor iOS- en Android-deployment
  • Lokaal: Ollama, llama.cpp, MLX voor privé on-device inferentie
Van browser tot telefoon tot Raspberry Pi

Visie en documenten

Beeldbegrip en documentanalyse on-device

De visie-encoder van ~150M verwerkt afbeeldingen met variabele beeldverhoudingen en configureerbare token-budgetten. Sterke OCR en documentbegrip maken het praktisch voor on-device documentanalyse.

  • 52,6% op MMMU Pro voor multimodaal redeneren
  • Variabele beeldresolutie: 70 tot 1120 tokens per afbeelding
  • Documentanalyse, OCR, grafiekbegrip on-device
Beeldbegrip en documentanalyse on-device

Onderdeel van Gemma 4

Het edge-model in een topfamilie

Gemma 4 E4B is het aanbevolen edge-model in de Gemma 4-familie. Stap over naar 26B MoE of 31B Dense wanneer je meer kracht nodig hebt, of naar E2B voor de kleinste footprint.

Gemma 4 E2B

Ultracompact 2,3 miljard model voor de strengste hardwarebeperkingen

Vergelijk

Gemma 4 26B

MoE-model met bijna 31B-kwaliteit tegen 4B inferentiekosten

Meer informatie

Gemma 4 31B

Vlaggenschip dicht model voor maximale prestaties

Meer informatie

Documentatie

Volledige handleidingen voor integratie en deployment

Lees documentatie

Community

Sluit je aan bij ontwikkelaars die bouwen met Gemma

Ontdek

Modelkaart

Technische specificaties en evaluatieresultaten

Bekijk details

Aan de slag

Klaar om AI on-device te draaien met Gemma 4 E4B?

Begin gratis met chatten of download het model voor privé on-device deployment. Geen data verlaat je apparaat.