モデルバリエーション
エッジデプロイ向けインストラクションチューニング済み
Gemma 4 E4Bは、Per-Layer Embeddings(PLE)によりパラメータ効率を最大化し、コンパクトなアーキテクチャから高い性能を引き出します。
インストラクションチューニング済み
E4B Instruct
対話型AI、音声理解、オンデバイスタスク処理に最適化
音声入力を含むネイティブマルチモーダル対応の指示追従モデル
事前学習済み
E4B Base
エッジ・モバイルアプリケーション向けファインチューニング用基盤モデル
音声を含む多様なマルチモーダルデータで事前学習済み、最大限の柔軟性を実現
機能
エッジハードウェアでデスクトップ級の知能を
Gemma 4 E4Bは、マルチモーダル理解、コーディング支援、推論能力を手のひらサイズのデバイスに届けます。
ネイティブ音声入力
USMスタイルのConformerオーディオエンコーダが最大30秒の音声・オーディオクリップを直接処理。文字起こしパイプラインは不要です。
高い推論能力
設定可能なシンキングモードを搭載。AIME 2026の数学で42.5%、GPQA Diamondの大学院レベル科学で58.6%を達成。
実用的なコーディング
LiveCodeBench v6で52%、Codeforces ELO 940を達成。ネイティブファンクションコーリングによりオンデバイスのエージェントワークフローに対応。
128Kコンテキストウィンドウ
長文ドキュメント、コードベース全体、長時間の会話をオンデバイスで処理。ハイブリッドローカル/グローバルアテンションを採用。
画像理解
MMMU Proで52.6%、MATH-Visionで59.5%を達成。可変アスペクト比対応と設定可能な画像トークンバジェットを搭載。
どこでも動作
WebGPUでブラウザ上、ONNXでスマートフォン上、OllamaでノートPC上で動作。4ビット量子化で最小5.5GBのVRAMで実行可能。
主なハイライト
エッジパフォーマンス指標
Gemma 4 E4Bは、コンシューマーハードウェアに収まりながら、多様なベンチマークで優れた結果を達成しています。
主な実績
- MMLU Pro 知識と推論で69.4%
- LiveCodeBench v6 コーディングで52%
- GPQA Diamond 科学知識で58.6%
- MMMU Pro マルチモーダル推論で52.6%
- 128Kトークンのコンテキストウィンドウ
技術仕様
- 実効パラメータ4.5B(エンベディング込みで8B)
- Per-Layer Embeddings搭載の42デコーダレイヤー
- 約150Mビジョンエンコーダ + 約300Mオーディオエンコーダ
- テキスト・画像・動画・音声のネイティブ入力対応
- 4ビット量子化で5.5-6GB VRAM
パフォーマンス
サイズを超えた圧倒的な性能
Gemma 4 E4Bは、わずか4.5Bの実効パラメータでMMLU Proで69.4%、LiveCodeBench v6で52%を達成し、2倍のサイズのモデルを上回る性能を発揮します。
MMLU Pro 69.4% - エッジモデルとして優れた知識と推論能力
LiveCodeBench v6 52% - オンデバイスでの実用的なコーディング支援
GPQA Diamond 58.6% - 大学院レベルの科学理解
MMMU Pro 52.6% - 画像を含むマルチモーダル推論
Codeforces ELO 940 - 競技プログラミング能力
ベンチマーク比較
E4B vs Gemma 4ファミリーおよびGemma 3
Gemma 4 E4Bは優れたエッジ性能を発揮し、より大きなモデルがより高負荷なワークロードに対応します。
| Benchmark | Gemma 4 E4B IT Thinking 注目 | Gemma 4 E2B IT Thinking | Gemma 4 31B IT Thinking | Gemma 3 27B IT |
|---|---|---|---|---|
MMLU Pro 知識と推論 | 69.4% | 60.0% | 85.2% | 67.6% |
AIME 2026 数学 ツールなし | 42.5% | 37.5% | 89.2% | 20.8% |
GPQA Diamond 科学知識 | 58.6% | 43.4% | 84.3% | 42.4% |
LiveCodeBench v6 競技コーディング | 52.0% | 44.0% | 80.0% | 29.1% |
Codeforces ELO 競技プログラミング | 940 | 633 | 2150 | - |
MMMU Pro マルチモーダル推論 | 52.6% | 44.2% | 76.9% | 49.7% |
MATH-Vision 視覚数学推論 | 59.5% | 52.4% | 85.6% | - |
Audio Support ネイティブ音声入力 | Yes | Yes | No | No |
Context Window 最大トークン数 | 128K | 128K | 256K | 128K |
ベンチマーク結果はGemma 4公式モデルカードより。E4Bのベンチマークはパラメータ数に対する卓越した効率性を示しています。
エッジデプロイ
ブラウザからスマートフォン、Raspberry Piまで
Gemma 4 E4Bはあらゆる環境へのデプロイを想定して設計されています。ChromeでWebGPU経由のtransformers.js、スマートフォンでONNX、ノートPCでOllamaで実行可能。4ビット量子化で最小5.5GBのVRAMで動作します。
- ブラウザ: ChromeでWebGPUアクセラレーション対応のtransformers.js
- モバイル: iOSおよびAndroidデプロイ向けONNXチェックポイント
- ローカル: Ollama、llama.cpp、MLXによるプライベートなオンデバイス推論
はじめに
Gemma 4 E4Bを今すぐ試す
すぐにチャットを開始するか、オンデバイスデプロイ用にダウンロードできます。
ウェイトのダウンロード
オンデバイスデプロイ
エッジおよびローカルデプロイ用の公式モデルウェイトをダウンロードできます。
エッジプラットフォーム
ブラウザおよびモバイルデプロイ
エッジデバイス、ブラウザ、モバイルプラットフォームへのデプロイ。
はじめに
Gemma 4 E4Bでオンデバイスの AI を始めませんか?
無料ですぐにチャットを開始するか、プライベートなオンデバイスデプロイ用にモデルをダウンロードできます。データがデバイスの外に出ることはありません。

