Gemma 4 E2B

Gemma 4最小モデル - 23億パラメータでフルマルチモーダル

Gemma 4 E2Bは、わずか23億の有効パラメータにテキスト・画像・音声の理解能力を凝縮。128Kコンテキストと最小4GB RAMで、スマートフォンやIoTデバイス、限られたハードウェア環境でも本格的なAI機能を実現します。

モデルバリエーション

超小型インストラクションチューニングモデル

Gemma 4 E2Bは、Per-Layer Embeddings（PLE）により、最小限のパラメータから最大限の性能を引き出します。

Per-Layer Embeddings アーキテクチャ

有効パラメータ23億、Embeddings込みで総計51億

Gemma 4 E2BはPLEを活用し、35層のデコーダレイヤーそれぞれに独自の条件付けパスを持たせています。約1.5億パラメータのビジョンエンコーダと約3億パラメータのオーディオエンコーダにより、最小限の計算コストでテキスト・画像・音声をネイティブに処理します。

Gemma 4への最も手軽なエントリーポイント。スマートフォン、IoT、Raspberry Piなど、メモリが最大の制約となる環境に最適です。

チャットを始める機能を見る

インストラクションチューニング済み

E2B Instruct

音声理解を備えたオンデバイス対話AIに最適化

ネイティブマルチモーダル対応で指示に従うようファインチューニング済み

提供中

チャットを始める重みをダウンロード

事前学習済み

E2B Base

超小型エッジアプリケーションのファインチューニング用基盤モデル

多様なマルチモーダルデータで事前学習済み。最小サイズで最大限の柔軟性を実現

提供中

HuggingFaceで見るファインチューニングガイド

機能

最小スケールで実現する本格AI機能

Gemma 4 E2Bは、実用的なAIに大規模ハードウェアが不要であることを証明します。スマートフォンに収まるモデルで、音声・画像・推論・コーディングに対応。

ネイティブ音声入力

USMスタイルのConformerオーディオエンコーダが、最大30秒の音声・オーディオクリップを処理。最小デバイスでも音声アシスタントや音声分析が可能です。

実用的な推論能力

MMLU Proで60%、AIME 2026数学で37.5%を達成。設定可能なシンキングモードで、デバイス上でのステップバイステップの問題解決に対応。

コーディング支援

LiveCodeBench v6で44%、Codeforces ELO 633を達成。制約のあるハードウェアでも実用的なコード生成とデバッグが可能です。

128Kコンテキストウィンドウ

デバイス上での長文ドキュメント処理や長時間の会話に対応。ハイブリッドアテンションによりメモリ使用量を実用的な範囲に抑えます。

画像理解

MMMU Proで44.2%を達成。可変アスペクト比に対応し、デバイス上でのドキュメント解析、OCR、画像分析が可能です。

最小フットプリント

4ビット量子化でわずか3.2GB VRAM。スマートフォン、Raspberry Pi、エントリーモデルのノートPCで動作します。

主なハイライト

超小型モデルの性能指標

Gemma 4 E2Bは、最も制約の厳しいハードウェアに収まりながら、多様なタスクで実用的な成果を発揮します。

主な実績

MMLU Pro 知識・推論で60%
LiveCodeBench v6 コーディングで44%
GPQA Diamond 科学知識で43.4%
MMMU Pro マルチモーダル推論で44.2%
128Kトークンのコンテキストウィンドウ

技術仕様

有効パラメータ23億（Embeddings込みで51億）
Per-Layer Embeddings搭載の35デコーダレイヤー
約1.5億ビジョンエンコーダ + 約3億オーディオエンコーダ
テキスト・画像・動画・音声のネイティブ入力対応
4ビット量子化で3.2〜4GB VRAM

チャットを始めるモデルカードを見る

性能

最小スケールで実現する実用AI

Gemma 4 E2Bは、わずか23億の有効パラメータでMMLU Pro 60%、LiveCodeBench v6 44%を達成。実用的なAIがポケットに収まることを証明します。

Gemma 4 E2Bは、ファミリー最小のモデルでも、推論・コーディング・マルチモーダルタスクで実用的な価値を提供できることを示しています。

チャットを始めるモデルカードを見る

MMLU Proで60% - 超小型モデルとして確かな知識と推論力

LiveCodeBench v6で44% - 最小限のハードウェアで実用的なコーディング支援

GPQA Diamondで43.4% - 23億パラメータで科学的理解力

MMMU Proで44.2% - デバイス上でのマルチモーダル推論

コンシューマーハードウェアで毎秒95トークン - 超高速推論

ベンチマーク比較

E2B vs E4B とGemma 4ファミリー

Gemma 4 E2Bはファミリー最小のモデルです。より高い品質にはE4B、フロンティア性能には26B/31Bをお選びください。

Benchmark	Gemma 4 E2B IT Thinking 注目	Gemma 4 E4B IT Thinking	Gemma 4 26B A4B IT Thinking	Gemma 4 31B IT Thinking
MMLU Pro 知識・推論	60.0%	69.4%	82.6%	85.2%
AIME 2026 数学ツールなし	37.5%	42.5%	88.3%	89.2%
GPQA Diamond 科学知識	43.4%	58.6%	82.3%	84.3%
LiveCodeBench v6 競技プログラミング	44.0%	52.0%	77.1%	80.0%
Codeforces ELO 競技プログラミング	633	940	1718	2150
MMMU Pro マルチモーダル推論	44.2%	52.6%	73.8%	76.9%
VRAM (4-bit) 最小メモリ	~3.2 GB	~5.5 GB	~16 GB	~17 GB
Audio Support ネイティブ音声入力	対応	対応	非対応	非対応