모델 변형
초소형 인스트럭션 튜닝 모델
Gemma 4 E2B는 Per-Layer Embeddings(PLE)를 활용하여 최소한의 파라미터에서 최대 성능을 이끌어냅니다.
사전 학습
E2B Base
초소형 엣지 애플리케이션 파인튜닝을 위한 기반 모델
다양한 멀티모달 데이터로 사전 학습하여 최소 크기에서 최대 유연성 제공
기능
가장 작은 규모에서 실현하는 진짜 AI 기능
Gemma 4 E2B는 실용적인 AI에 대규모 하드웨어가 필요하지 않음을 증명합니다. 스마트폰에 들어가는 모델로 오디오, 비전, 추론, 코딩을 지원합니다.
네이티브 오디오 입력
USM 스타일 Conformer 오디오 인코더가 최대 30초의 음성 및 오디오 클립을 처리합니다. 가장 작은 기기에서도 음성 어시스턴트와 오디오 분석이 가능합니다.
실용적 추론
MMLU Pro 60%, AIME 2026 수학 37.5% 달성. 설정 가능한 사고 모드로 디바이스에서 단계별 문제 해결을 지원합니다.
코딩 지원
LiveCodeBench v6 44%, Codeforces ELO 633 달성. 제한된 하드웨어에서도 실용적인 코드 생성과 디버깅이 가능합니다.
128K 컨텍스트 윈도우
디바이스에서 긴 문서 처리와 장시간 대화를 지원합니다. 하이브리드 어텐션으로 메모리 사용량을 실용적 수준으로 유지합니다.
비전 이해
MMMU Pro 44.2% 달성. 가변 종횡비를 지원하여 디바이스에서 문서 파싱, OCR, 이미지 분석이 가능합니다.
최소 풋프린트
4비트 양자화 시 최소 3.2GB VRAM. 스마트폰, Raspberry Pi, 보급형 노트북에서 실행됩니다.
주요 하이라이트
초소형 모델 성능 지표
Gemma 4 E2B는 가장 제한된 하드웨어에 맞으면서도 다양한 작업에서 의미 있는 결과를 제공합니다.
주요 성과
- MMLU Pro 지식 및 추론 60%
- LiveCodeBench v6 코딩 44%
- GPQA Diamond 과학 지식 43.4%
- MMMU Pro 멀티모달 추론 44.2%
- 128K 토큰 컨텍스트 윈도우
기술 사양
- 유효 파라미터 23억 (Embeddings 포함 51억)
- Per-Layer Embeddings 탑재 35개 디코더 레이어
- 약 1.5억 비전 인코더 + 약 3억 오디오 인코더
- 텍스트, 이미지, 동영상, 오디오 네이티브 입력
- 4비트 양자화 시 3.2~4GB VRAM
성능
가장 작은 규모에서 실현하는 실용 AI
Gemma 4 E2B는 단 23억 유효 파라미터로 MMLU Pro 60%, LiveCodeBench v6 44%를 달성하며, 실용적인 AI가 주머니에 들어갈 수 있음을 증명합니다.
MMLU Pro 60% - 초소형 모델로서 탄탄한 지식과 추론력
LiveCodeBench v6 44% - 최소 하드웨어에서 실용적 코딩 지원
GPQA Diamond 43.4% - 23억 파라미터로 과학적 이해력
MMMU Pro 44.2% - 디바이스에서의 멀티모달 추론
소비자 하드웨어에서 초당 95토큰 - 초고속 추론
벤치마크 비교
E2B vs E4B 및 Gemma 4 패밀리
Gemma 4 E2B는 패밀리에서 가장 작은 모델입니다. 더 높은 품질은 E4B, 프론티어 성능은 26B/31B를 선택하세요.
| Benchmark | Gemma 4 E2B IT Thinking 주목 | Gemma 4 E4B IT Thinking | Gemma 4 26B A4B IT Thinking | Gemma 4 31B IT Thinking |
|---|---|---|---|---|
MMLU Pro 지식 및 추론 | 60.0% | 69.4% | 82.6% | 85.2% |
AIME 2026 수학 도구 없음 | 37.5% | 42.5% | 88.3% | 89.2% |
GPQA Diamond 과학 지식 | 43.4% | 58.6% | 82.3% | 84.3% |
LiveCodeBench v6 경쟁 코딩 | 44.0% | 52.0% | 77.1% | 80.0% |
Codeforces ELO 경쟁 프로그래밍 | 633 | 940 | 1718 | 2150 |
MMMU Pro 멀티모달 추론 | 44.2% | 52.6% | 73.8% | 76.9% |
VRAM (4-bit) 최소 메모리 | ~3.2 GB | ~5.5 GB | ~16 GB | ~17 GB |
Audio Support 네이티브 오디오 입력 | 지원 | 지원 | 미지원 | 미지원 |
Gemma 4 공식 모델 카드의 벤치마크 결과. E2B 벤치마크는 최소 파라미터 수에서의 실용적 능력을 보여줍니다.
시작하기
지금 Gemma 4 E2B를 체험하세요
바로 채팅을 시작하거나 초소형 배포를 위해 다운로드하세요.
가중치 다운로드
초소형 배포
가장 작은 배포를 위한 공식 모델 가중치를 다운로드하세요.
엣지 플랫폼
스마트폰, 브라우저, IoT 배포
최적화된 런타임으로 가장 작은 기기에 배포하세요.

