Gemma 4 E2B

가장 작은 Gemma 4 - 23억 파라미터로 완전한 멀티모달 지능

Gemma 4 E2B는 단 23억 유효 파라미터에 텍스트, 이미지, 오디오 이해 능력을 담았습니다. 128K 컨텍스트와 최소 4GB RAM으로 스마트폰, IoT 기기, 가장 제한된 하드웨어 환경에서도 진정한 AI 기능을 제공합니다.

채팅 시작하기 벤치마크 보기

모델 변형

초소형 인스트럭션 튜닝 모델

Gemma 4 E2B는 Per-Layer Embeddings(PLE)를 활용하여 최소한의 파라미터에서 최대 성능을 이끌어냅니다.

Per-Layer Embeddings 아키텍처

유효 파라미터 23억, Embeddings 포함 총 51억

Gemma 4 E2B는 PLE를 사용하여 35개 디코더 레이어 각각에 고유한 컨디셔닝 경로를 부여합니다. 약 1.5억 파라미터의 비전 인코더와 약 3억 파라미터의 오디오 인코더로 최소한의 연산 비용으로 텍스트, 이미지, 오디오를 네이티브로 처리합니다.

Gemma 4에 가장 쉽게 진입할 수 있는 모델입니다. 스마트폰, IoT, Raspberry Pi 등 메모리가 가장 큰 제약인 환경에 이상적입니다.

채팅 시작하기 기능 살펴보기

인스트럭션 튜닝

E2B Instruct

오디오 이해를 갖춘 온디바이스 대화형 AI에 최적화

네이티브 멀티모달 지원으로 지시를 따르도록 파인튜닝

지금 이용 가능

채팅 시작하기 가중치 다운로드

사전 학습

E2B Base

초소형 엣지 애플리케이션 파인튜닝을 위한 기반 모델

다양한 멀티모달 데이터로 사전 학습하여 최소 크기에서 최대 유연성 제공

지금 이용 가능

HuggingFace에서 보기 파인튜닝 가이드

기능

가장 작은 규모에서 실현하는 진짜 AI 기능

Gemma 4 E2B는 실용적인 AI에 대규모 하드웨어가 필요하지 않음을 증명합니다. 스마트폰에 들어가는 모델로 오디오, 비전, 추론, 코딩을 지원합니다.

네이티브 오디오 입력

USM 스타일 Conformer 오디오 인코더가 최대 30초의 음성 및 오디오 클립을 처리합니다. 가장 작은 기기에서도 음성 어시스턴트와 오디오 분석이 가능합니다.

실용적 추론

MMLU Pro 60%, AIME 2026 수학 37.5% 달성. 설정 가능한 사고 모드로 디바이스에서 단계별 문제 해결을 지원합니다.

코딩 지원

LiveCodeBench v6 44%, Codeforces ELO 633 달성. 제한된 하드웨어에서도 실용적인 코드 생성과 디버깅이 가능합니다.

128K 컨텍스트 윈도우

디바이스에서 긴 문서 처리와 장시간 대화를 지원합니다. 하이브리드 어텐션으로 메모리 사용량을 실용적 수준으로 유지합니다.

비전 이해

MMMU Pro 44.2% 달성. 가변 종횡비를 지원하여 디바이스에서 문서 파싱, OCR, 이미지 분석이 가능합니다.

최소 풋프린트

4비트 양자화 시 최소 3.2GB VRAM. 스마트폰, Raspberry Pi, 보급형 노트북에서 실행됩니다.

주요 하이라이트

초소형 모델 성능 지표

Gemma 4 E2B는 가장 제한된 하드웨어에 맞으면서도 다양한 작업에서 의미 있는 결과를 제공합니다.

주요 성과

MMLU Pro 지식 및 추론 60%
LiveCodeBench v6 코딩 44%
GPQA Diamond 과학 지식 43.4%
MMMU Pro 멀티모달 추론 44.2%
128K 토큰 컨텍스트 윈도우

기술 사양

유효 파라미터 23억 (Embeddings 포함 51억)
Per-Layer Embeddings 탑재 35개 디코더 레이어
약 1.5억 비전 인코더 + 약 3억 오디오 인코더
텍스트, 이미지, 동영상, 오디오 네이티브 입력
4비트 양자화 시 3.2~4GB VRAM

채팅 시작하기 모델 카드 보기

성능

가장 작은 규모에서 실현하는 실용 AI

Gemma 4 E2B는 단 23억 유효 파라미터로 MMLU Pro 60%, LiveCodeBench v6 44%를 달성하며, 실용적인 AI가 주머니에 들어갈 수 있음을 증명합니다.

Gemma 4 E2B는 패밀리에서 가장 작은 모델도 추론, 코딩, 멀티모달 작업에서 실질적인 가치를 제공할 수 있음을 보여줍니다.

채팅 시작하기 모델 카드 보기

MMLU Pro 60% - 초소형 모델로서 탄탄한 지식과 추론력

LiveCodeBench v6 44% - 최소 하드웨어에서 실용적 코딩 지원

GPQA Diamond 43.4% - 23억 파라미터로 과학적 이해력

MMMU Pro 44.2% - 디바이스에서의 멀티모달 추론

소비자 하드웨어에서 초당 95토큰 - 초고속 추론

벤치마크 비교

E2B vs E4B 및 Gemma 4 패밀리

Gemma 4 E2B는 패밀리에서 가장 작은 모델입니다. 더 높은 품질은 E4B, 프론티어 성능은 26B/31B를 선택하세요.

Benchmark	Gemma 4 E2B IT Thinking 주목	Gemma 4 E4B IT Thinking	Gemma 4 26B A4B IT Thinking	Gemma 4 31B IT Thinking
MMLU Pro 지식 및 추론	60.0%	69.4%	82.6%	85.2%
AIME 2026 수학 도구 없음	37.5%	42.5%	88.3%	89.2%
GPQA Diamond 과학 지식	43.4%	58.6%	82.3%	84.3%
LiveCodeBench v6 경쟁 코딩	44.0%	52.0%	77.1%	80.0%
Codeforces ELO 경쟁 프로그래밍	633	940	1718	2150
MMMU Pro 멀티모달 추론	44.2%	52.6%	73.8%	76.9%
VRAM (4-bit) 최소 메모리	~3.2 GB	~5.5 GB	~16 GB	~17 GB
Audio Support 네이티브 오디오 입력	지원	지원	미지원	미지원