Gemma 4 E2B

Gemma 4最小モデル - 23億パラメータでフルマルチモーダル

Gemma 4 E2Bは、わずか23億の有効パラメータにテキスト・画像・音声の理解能力を凝縮。128Kコンテキストと最小4GB RAMで、スマートフォンやIoTデバイス、限られたハードウェア環境でも本格的なAI機能を実現します。

モデルバリエーション

超小型インストラクションチューニングモデル

Gemma 4 E2Bは、Per-Layer Embeddings(PLE)により、最小限のパラメータから最大限の性能を引き出します。

Per-Layer Embeddings アーキテクチャ

有効パラメータ23億、Embeddings込みで総計51億

Gemma 4 E2BはPLEを活用し、35層のデコーダレイヤーそれぞれに独自の条件付けパスを持たせています。約1.5億パラメータのビジョンエンコーダと約3億パラメータのオーディオエンコーダにより、最小限の計算コストでテキスト・画像・音声をネイティブに処理します。

Gemma 4への最も手軽なエントリーポイント。スマートフォン、IoT、Raspberry Piなど、メモリが最大の制約となる環境に最適です。

インストラクションチューニング済み

E2B Instruct

音声理解を備えたオンデバイス対話AIに最適化

ネイティブマルチモーダル対応で指示に従うようファインチューニング済み

提供中

事前学習済み

E2B Base

超小型エッジアプリケーションのファインチューニング用基盤モデル

多様なマルチモーダルデータで事前学習済み。最小サイズで最大限の柔軟性を実現

提供中

機能

最小スケールで実現する本格AI機能

Gemma 4 E2Bは、実用的なAIに大規模ハードウェアが不要であることを証明します。スマートフォンに収まるモデルで、音声・画像・推論・コーディングに対応。

ネイティブ音声入力

USMスタイルのConformerオーディオエンコーダが、最大30秒の音声・オーディオクリップを処理。最小デバイスでも音声アシスタントや音声分析が可能です。

実用的な推論能力

MMLU Proで60%、AIME 2026数学で37.5%を達成。設定可能なシンキングモードで、デバイス上でのステップバイステップの問題解決に対応。

コーディング支援

LiveCodeBench v6で44%、Codeforces ELO 633を達成。制約のあるハードウェアでも実用的なコード生成とデバッグが可能です。

128Kコンテキストウィンドウ

デバイス上での長文ドキュメント処理や長時間の会話に対応。ハイブリッドアテンションによりメモリ使用量を実用的な範囲に抑えます。

画像理解

MMMU Proで44.2%を達成。可変アスペクト比に対応し、デバイス上でのドキュメント解析、OCR、画像分析が可能です。

最小フットプリント

4ビット量子化でわずか3.2GB VRAM。スマートフォン、Raspberry Pi、エントリーモデルのノートPCで動作します。

主なハイライト

超小型モデルの性能指標

Gemma 4 E2Bは、最も制約の厳しいハードウェアに収まりながら、多様なタスクで実用的な成果を発揮します。

主な実績

  • MMLU Pro 知識・推論で60%
  • LiveCodeBench v6 コーディングで44%
  • GPQA Diamond 科学知識で43.4%
  • MMMU Pro マルチモーダル推論で44.2%
  • 128Kトークンのコンテキストウィンドウ

技術仕様

  • 有効パラメータ23億(Embeddings込みで51億)
  • Per-Layer Embeddings搭載の35デコーダレイヤー
  • 約1.5億ビジョンエンコーダ + 約3億オーディオエンコーダ
  • テキスト・画像・動画・音声のネイティブ入力対応
  • 4ビット量子化で3.2〜4GB VRAM

性能

最小スケールで実現する実用AI

Gemma 4 E2Bは、わずか23億の有効パラメータでMMLU Pro 60%、LiveCodeBench v6 44%を達成。実用的なAIがポケットに収まることを証明します。

Gemma 4 E2Bは、ファミリー最小のモデルでも、推論・コーディング・マルチモーダルタスクで実用的な価値を提供できることを示しています。

Gemma 4 E2B 性能比較チャート

MMLU Proで60% - 超小型モデルとして確かな知識と推論力

LiveCodeBench v6で44% - 最小限のハードウェアで実用的なコーディング支援

GPQA Diamondで43.4% - 23億パラメータで科学的理解力

MMMU Proで44.2% - デバイス上でのマルチモーダル推論

コンシューマーハードウェアで毎秒95トークン - 超高速推論

ベンチマーク比較

E2B vs E4B とGemma 4ファミリー

Gemma 4 E2Bはファミリー最小のモデルです。より高い品質にはE4B、フロンティア性能には26B/31Bをお選びください。

Benchmark
Gemma 4 E2B IT
Thinking
注目
Gemma 4 E4B IT
Thinking
Gemma 4 26B A4B IT
Thinking
Gemma 4 31B IT
Thinking
MMLU Pro
知識・推論
60.0%69.4%82.6%85.2%
AIME 2026
数学
ツールなし
37.5%42.5%88.3%89.2%
GPQA Diamond
科学知識
43.4%58.6%82.3%84.3%
LiveCodeBench v6
競技プログラミング
44.0%52.0%77.1%80.0%
Codeforces ELO
競技プログラミング
63394017182150
MMMU Pro
マルチモーダル推論
44.2%52.6%73.8%76.9%
VRAM (4-bit)
最小メモリ
~3.2 GB~5.5 GB~16 GB~17 GB
Audio Support
ネイティブ音声入力
対応対応非対応非対応

Gemma 4公式モデルカードのベンチマーク結果。E2Bベンチマークは最小パラメータ数での実用的な能力を示しています。

超小型

Gemma 4最小パッケージでフルマルチモーダルAI

Gemma 4 E2Bは機能を削ったモデルではありません。上位モデルと同じマルチモーダルアーキテクチャ(テキスト・画像・動画・音声入力)を、23億の有効パラメータに凝縮しています。

  • E4Bと同じモダリティ:テキスト・画像・動画・音声入力
  • 上位エッジモデルと同じ128Kコンテキストウィンドウ
  • 4ビットで3.2GB VRAM - スマートフォンやエントリーモデルのハードウェアに対応
Gemma 4最小パッケージでフルマルチモーダルAI

超高速

コンシューマーハードウェアで毎秒95トークン

ファミリー最小のモデルは、最速でもあります。Gemma 4 E2Bはコンシューマーハードウェアでほぼ瞬時に応答し、リアルタイムアプリケーションやインタラクティブな体験に最適です。

  • コンシューマーGPUで毎秒約95トークン
  • ほとんどのハードウェアで1秒未満のファーストトークンレイテンシ
  • リアルタイムチャット、音声アシスタント、インタラクティブツールに最適
コンシューマーハードウェアで毎秒95トークン

IoT & Edge

手のひらに収まるデバイスのためのAI

Gemma 4 E2Bはエッジ向けに設計されています。Pixelスマートフォン、Raspberry Pi、Chromeブラウザなど、ベンチマークスコアよりもプライバシーとレイテンシが重要なあらゆるデバイスで動作します。

  • クロスプラットフォームエッジデプロイ用ONNXチェックポイント
  • ブラウザ内推論のためのWebGPUサポート
  • Pixel、Chrome、IoT環境向けに設計
手のひらに収まるデバイスのためのAI

重みをダウンロード

超小型デプロイメント

最小限のデプロイのための公式モデル重みをダウンロード。

エッジプラットフォーム

スマートフォン・ブラウザ・IoTデプロイ

最適化されたランタイムで最小デバイスにデプロイ。

Gemma 4ファミリー

フロンティアファミリーの最小モデル

Gemma 4 E2BはGemma 4ファミリーへのエントリーポイントです。より高い品質にはE4B、フロンティア性能には26B/31Bをお選びください。

Gemma 4 E4B

45億有効パラメータのより強力なエッジモデル

比較する

Gemma 4 26B

4Bの推論コストで31Bに迫る品質のMoEモデル

詳しく見る

Gemma 4 31B

最高性能のフラッグシップ密結合モデル

詳しく見る

ドキュメント

統合とデプロイの完全ガイド

ドキュメントを読む

コミュニティ

Gemmaで開発する仲間に参加

探索する

モデルカード

技術仕様と評価結果

詳細を見る

はじめに

最小デバイスでAIを動かす準備はできましたか?

無料でチャットを始めるか、Gemma 4 E2Bをダウンロードして超小型・プライベート・オンデバイスのデプロイを実現しましょう。