Gemma 4 E4B

45億パラメータのオンデバイス知能、ネイティブ音声対応

Gemma 4 E4Bは、4.5Bの実効パラメータでノートPC、スマートフォン、ブラウザ上で動作するモデルです。音声・画像・テキストのネイティブ理解と128Kコンテキストウィンドウにより、最先端のマルチモーダルAIをエッジデバイスに届けます。

チャットを始めるベンチマークを見る

モデルバリエーション

エッジデプロイ向けインストラクションチューニング済み

Gemma 4 E4Bは、Per-Layer Embeddings（PLE）によりパラメータ効率を最大化し、コンパクトなアーキテクチャから高い性能を引き出します。

Per-Layer Embeddingsアーキテクチャ

実効パラメータ4.5B、エンベディング込みで総計8B

Gemma 4 E4Bは、PLEにより各デコーダレイヤーに独自の条件付けパスを持たせています。42層のデコーダに加え、約150Mのビジョンエンコーダと約300Mのオーディオエンコーダを搭載し、テキスト・画像・音声をネイティブに処理します。

オンデバイスデプロイ、ブラウザベースAI、データがユーザーのデバイスから離れないプライバシー重視のアプリケーションに最適です。

チャットを始める機能を見る

インストラクションチューニング済み

E4B Instruct

対話型AI、音声理解、オンデバイスタスク処理に最適化

音声入力を含むネイティブマルチモーダル対応の指示追従モデル

提供中

チャットを始めるウェイトをダウンロード

事前学習済み

E4B Base

エッジ・モバイルアプリケーション向けファインチューニング用基盤モデル

音声を含む多様なマルチモーダルデータで事前学習済み、最大限の柔軟性を実現

提供中

HuggingFaceで見るファインチューニングガイド

機能

エッジハードウェアでデスクトップ級の知能を

Gemma 4 E4Bは、マルチモーダル理解、コーディング支援、推論能力を手のひらサイズのデバイスに届けます。

ネイティブ音声入力

USMスタイルのConformerオーディオエンコーダが最大30秒の音声・オーディオクリップを直接処理。文字起こしパイプラインは不要です。

高い推論能力

設定可能なシンキングモードを搭載。AIME 2026の数学で42.5%、GPQA Diamondの大学院レベル科学で58.6%を達成。

実用的なコーディング

LiveCodeBench v6で52%、Codeforces ELO 940を達成。ネイティブファンクションコーリングによりオンデバイスのエージェントワークフローに対応。

128Kコンテキストウィンドウ

長文ドキュメント、コードベース全体、長時間の会話をオンデバイスで処理。ハイブリッドローカル/グローバルアテンションを採用。

画像理解

MMMU Proで52.6%、MATH-Visionで59.5%を達成。可変アスペクト比対応と設定可能な画像トークンバジェットを搭載。

どこでも動作

WebGPUでブラウザ上、ONNXでスマートフォン上、OllamaでノートPC上で動作。4ビット量子化で最小5.5GBのVRAMで実行可能。

主なハイライト

エッジパフォーマンス指標

Gemma 4 E4Bは、コンシューマーハードウェアに収まりながら、多様なベンチマークで優れた結果を達成しています。

主な実績

MMLU Pro 知識と推論で69.4%
LiveCodeBench v6 コーディングで52%
GPQA Diamond 科学知識で58.6%
MMMU Pro マルチモーダル推論で52.6%
128Kトークンのコンテキストウィンドウ

技術仕様

実効パラメータ4.5B（エンベディング込みで8B）
Per-Layer Embeddings搭載の42デコーダレイヤー
約150Mビジョンエンコーダ + 約300Mオーディオエンコーダ
テキスト・画像・動画・音声のネイティブ入力対応
4ビット量子化で5.5-6GB VRAM

チャットを始めるモデルカードを見る

パフォーマンス

サイズを超えた圧倒的な性能

Gemma 4 E4Bは、わずか4.5Bの実効パラメータでMMLU Proで69.4%、LiveCodeBench v6で52%を達成し、2倍のサイズのモデルを上回る性能を発揮します。

Gemma 4 E4Bは、エッジモデルでも推論・コーディング・マルチモーダルタスクで実用的な性能を発揮できることを実証しています。

チャットを始めるモデルカードを見る

MMLU Pro 69.4% - エッジモデルとして優れた知識と推論能力

LiveCodeBench v6 52% - オンデバイスでの実用的なコーディング支援

GPQA Diamond 58.6% - 大学院レベルの科学理解

MMMU Pro 52.6% - 画像を含むマルチモーダル推論

Codeforces ELO 940 - 競技プログラミング能力

ベンチマーク比較

E4B vs Gemma 4ファミリーおよびGemma 3

Gemma 4 E4Bは優れたエッジ性能を発揮し、より大きなモデルがより高負荷なワークロードに対応します。

Benchmark	Gemma 4 E4B IT Thinking 注目	Gemma 4 E2B IT Thinking	Gemma 4 31B IT Thinking	Gemma 3 27B IT
MMLU Pro 知識と推論	69.4%	60.0%	85.2%	67.6%
AIME 2026 数学ツールなし	42.5%	37.5%	89.2%	20.8%
GPQA Diamond 科学知識	58.6%	43.4%	84.3%	42.4%
LiveCodeBench v6 競技コーディング	52.0%	44.0%	80.0%	29.1%
Codeforces ELO 競技プログラミング	940	633	2150	-
MMMU Pro マルチモーダル推論	52.6%	44.2%	76.9%	49.7%
MATH-Vision 視覚数学推論	59.5%	52.4%	85.6%	-
Audio Support ネイティブ音声入力	Yes	Yes	No	No
Context Window 最大トークン数	128K	128K	256K	128K