Gemma 4 E2B

De kleinste Gemma 4 - volledige multimodale intelligentie in 2,3 miljard parameters

Gemma 4 E2B bundelt tekst-, beeld- en audiobegrip in slechts 2,3 miljard effectieve parameters. Met 128K context en slechts 4 GB RAM brengt het echte AI-mogelijkheden naar telefoons, IoT-apparaten en de krapste hardwarebudgetten.

Start een chat Bekijk benchmarks

Modelvarianten

Ultracompact Instruction-Tuned model

Gemma 4 E2B gebruikt Per-Layer Embeddings (PLE) om maximale capaciteit uit minimale parameters te halen.

Per-Layer Embeddings Architectuur

2,3 miljard effectieve parameters, 5,1 miljard totaal met embeddings

Gemma 4 E2B gebruikt PLE om elk van zijn 35 decoderlagen een eigen conditioneringspad te geven. Met een ~150M vision-encoder en een ~300M audio-encoder verwerkt het tekst, beelden en audio native met minimale rekenkosten.

Het laagdrempeligste instappunt voor Gemma 4. Ideaal voor telefoons, IoT, Raspberry Pi en elke implementatie waar geheugen de belangrijkste beperking is.

Start een chat Bekijk mogelijkheden

Instruction-Tuned

E2B Instruct

Geoptimaliseerd voor on-device conversationele AI met audiobegrip

Fijnafgestemd voor het opvolgen van instructies met native multimodale ondersteuning

Nu beschikbaar

Start een chat Download gewichten

Voorgetraind

E2B Base

Basismodel voor het finetunen van ultracompacte edge-applicaties

Voorgetraind op diverse multimodale data voor maximale flexibiliteit bij minimale omvang

Nu beschikbaar

Bekijk op HuggingFace Finetuning-handleiding

Mogelijkheden

Echte AI-mogelijkheden op de kleinste schaal

Gemma 4 E2B bewijst dat nuttige AI geen zware hardware vereist. Audio, beeld, redeneren en programmeren in een model dat op een telefoon past.

Native audio-invoer

De USM-achtige Conformer audio-encoder verwerkt spraak en audioclips tot 30 seconden. Spraakassistenten en audioanalyse op de kleinste apparaten.

Praktisch redeneren

60% op MMLU Pro en 37,5% op AIME 2026 wiskunde. Configureerbare denkmodus voor stapsgewijs probleemoplossen op het apparaat.

Programmeerassistentie

44% op LiveCodeBench v6 en 633 Codeforces ELO. Nuttige codegeneratie en debugging, zelfs op beperkte hardware.

128K contextvenster

Verwerking van lange documenten en uitgebreide gesprekken op het apparaat. Hybride aandacht houdt het geheugengebruik praktisch.

Beeldbegrip

44,2% op MMMU Pro. Ondersteuning voor variabele beeldverhoudingen voor documentanalyse, OCR en beeldanalyse op het apparaat.

Minimale voetafdruk

Slechts 3,2 GB VRAM bij 4-bit kwantisatie. Draait op telefoons, Raspberry Pi en budgetlaptops.

Belangrijkste highlights

Prestatiemetrieken van het ultracompacte model

Gemma 4 E2B levert betekenisvolle resultaten bij diverse taken en past op de meest beperkte hardware.

Topresultaten

60% op MMLU Pro kennis en redeneren
44% op LiveCodeBench v6 programmeren
43,4% op GPQA Diamond wetenschappelijke kennis
44,2% op MMMU Pro multimodaal redeneren
128K token contextvenster

Technische specificaties

2,3 miljard effectieve parameters (5,1 miljard met embeddings)
35 decoderlagen met Per-Layer Embeddings
~150M vision-encoder + ~300M audio-encoder
Native tekst-, beeld-, video- en audio-invoer
3,2-4 GB VRAM bij 4-bit kwantisatie

Start een chat Bekijk modelkaart

Prestaties

Betekenisvolle AI op de kleinste schaal

Gemma 4 E2B behaalt 60% op MMLU Pro en 44% op LiveCodeBench v6 met slechts 2,3 miljard effectieve parameters - het bewijs dat nuttige AI in je zak past.

Gemma 4 E2B toont aan dat zelfs de kleinste modellen in de familie praktische waarde bieden bij redeneren, programmeren en multimodale taken.

Start een chat Bekijk modelkaart

Gemma 4 E2B prestatievergelijkingsgrafiek

60% op MMLU Pro - solide kennis en redeneren voor een ultracompact model

44% op LiveCodeBench v6 - praktische programmeerhulp op minimale hardware

43,4% op GPQA Diamond - wetenschappelijk begrip in 2,3 miljard parameters

44,2% op MMMU Pro - multimodaal redeneren op het apparaat

95 tokens/seconde op consumentenhardware - razendsnelle inferentie

Benchmarkvergelijking

E2B vs E4B en de Gemma 4-familie

Gemma 4 E2B is het kleinste model in de familie. Stap over naar E4B voor betere kwaliteit, of naar 26B/31B voor topprestaties.

Benchmark	Gemma 4 E2B IT Thinking Uitgelicht	Gemma 4 E4B IT Thinking	Gemma 4 26B A4B IT Thinking	Gemma 4 31B IT Thinking
MMLU Pro Kennis & redeneren	60.0%	69.4%	82.6%	85.2%
AIME 2026 Wiskunde Zonder tools	37.5%	42.5%	88.3%	89.2%
GPQA Diamond Wetenschappelijke kennis	43.4%	58.6%	82.3%	84.3%
LiveCodeBench v6 Competitief programmeren	44.0%	52.0%	77.1%	80.0%
Codeforces ELO Competitief programmeren	633	940	1718	2150
MMMU Pro Multimodaal redeneren	44.2%	52.6%	73.8%	76.9%
VRAM (4-bit) Minimaal geheugen	~3.2 GB	~5.5 GB	~16 GB	~17 GB
Audio Support Native audio-invoer	Ja	Ja	Nee	Nee

Benchmarkresultaten van de officiële Gemma 4-modelkaart. E2B-benchmarks tonen praktische capaciteit bij minimaal parameteraantal.

Ultracompact

Volledige multimodale AI in het kleinste Gemma 4-pakket

Gemma 4 E2B is geen uitgekleed model. Het heeft dezelfde multimodale architectuur als zijn grotere broers en zussen - tekst-, beeld-, video- en audio-invoer - in een pakket van 2,3 miljard effectieve parameters.

Dezelfde modaliteiten als E4B: tekst-, beeld-, video- en audio-invoer
Hetzelfde 128K contextvenster als het grotere edge-model
3,2 GB VRAM bij 4-bit - past op telefoons en budgethardware

Start een chat Vergelijk met E4B

Volledige multimodale AI in het kleinste Gemma 4-pakket

Razend snel

95 tokens per seconde op consumentenhardware

Het kleinste model in de familie is ook het snelste. Gemma 4 E2B levert bijna directe antwoorden op consumentenhardware, ideaal voor realtime-applicaties en interactieve ervaringen.

~95 tokens/seconde op consumenten-GPU's
Minder dan een seconde tot het eerste token op de meeste hardware
Ideaal voor realtime chat, spraakassistenten en interactieve tools

Ervaar de snelheid Hardware-handleiding

95 tokens per seconde op consumentenhardware

IoT & Edge

AI voor apparaten die in je hand passen

Gemma 4 E2B is ontworpen voor de edge. Draai het op Pixel-telefoons, Raspberry Pi, Chrome-browsers en elk apparaat waar privacy en latentie belangrijker zijn dan benchmarkscores.