Gemma 4 E4B

45億パラメータのオンデバイス知能、ネイティブ音声対応

Gemma 4 E4Bは、4.5Bの実効パラメータでノートPC、スマートフォン、ブラウザ上で動作するモデルです。音声・画像・テキストのネイティブ理解と128Kコンテキストウィンドウにより、最先端のマルチモーダルAIをエッジデバイスに届けます。

モデルバリエーション

エッジデプロイ向けインストラクションチューニング済み

Gemma 4 E4Bは、Per-Layer Embeddings(PLE)によりパラメータ効率を最大化し、コンパクトなアーキテクチャから高い性能を引き出します。

Per-Layer Embeddingsアーキテクチャ

実効パラメータ4.5B、エンベディング込みで総計8B

Gemma 4 E4Bは、PLEにより各デコーダレイヤーに独自の条件付けパスを持たせています。42層のデコーダに加え、約150Mのビジョンエンコーダと約300Mのオーディオエンコーダを搭載し、テキスト・画像・音声をネイティブに処理します。

オンデバイスデプロイ、ブラウザベースAI、データがユーザーのデバイスから離れないプライバシー重視のアプリケーションに最適です。

インストラクションチューニング済み

E4B Instruct

対話型AI、音声理解、オンデバイスタスク処理に最適化

音声入力を含むネイティブマルチモーダル対応の指示追従モデル

提供中

事前学習済み

E4B Base

エッジ・モバイルアプリケーション向けファインチューニング用基盤モデル

音声を含む多様なマルチモーダルデータで事前学習済み、最大限の柔軟性を実現

提供中

機能

エッジハードウェアでデスクトップ級の知能を

Gemma 4 E4Bは、マルチモーダル理解、コーディング支援、推論能力を手のひらサイズのデバイスに届けます。

ネイティブ音声入力

USMスタイルのConformerオーディオエンコーダが最大30秒の音声・オーディオクリップを直接処理。文字起こしパイプラインは不要です。

高い推論能力

設定可能なシンキングモードを搭載。AIME 2026の数学で42.5%、GPQA Diamondの大学院レベル科学で58.6%を達成。

実用的なコーディング

LiveCodeBench v6で52%、Codeforces ELO 940を達成。ネイティブファンクションコーリングによりオンデバイスのエージェントワークフローに対応。

128Kコンテキストウィンドウ

長文ドキュメント、コードベース全体、長時間の会話をオンデバイスで処理。ハイブリッドローカル/グローバルアテンションを採用。

画像理解

MMMU Proで52.6%、MATH-Visionで59.5%を達成。可変アスペクト比対応と設定可能な画像トークンバジェットを搭載。

どこでも動作

WebGPUでブラウザ上、ONNXでスマートフォン上、OllamaでノートPC上で動作。4ビット量子化で最小5.5GBのVRAMで実行可能。

主なハイライト

エッジパフォーマンス指標

Gemma 4 E4Bは、コンシューマーハードウェアに収まりながら、多様なベンチマークで優れた結果を達成しています。

主な実績

  • MMLU Pro 知識と推論で69.4%
  • LiveCodeBench v6 コーディングで52%
  • GPQA Diamond 科学知識で58.6%
  • MMMU Pro マルチモーダル推論で52.6%
  • 128Kトークンのコンテキストウィンドウ

技術仕様

  • 実効パラメータ4.5B(エンベディング込みで8B)
  • Per-Layer Embeddings搭載の42デコーダレイヤー
  • 約150Mビジョンエンコーダ + 約300Mオーディオエンコーダ
  • テキスト・画像・動画・音声のネイティブ入力対応
  • 4ビット量子化で5.5-6GB VRAM

パフォーマンス

サイズを超えた圧倒的な性能

Gemma 4 E4Bは、わずか4.5Bの実効パラメータでMMLU Proで69.4%、LiveCodeBench v6で52%を達成し、2倍のサイズのモデルを上回る性能を発揮します。

Gemma 4 E4Bは、エッジモデルでも推論・コーディング・マルチモーダルタスクで実用的な性能を発揮できることを実証しています。

Gemma 4 E4B パフォーマンス比較チャート

MMLU Pro 69.4% - エッジモデルとして優れた知識と推論能力

LiveCodeBench v6 52% - オンデバイスでの実用的なコーディング支援

GPQA Diamond 58.6% - 大学院レベルの科学理解

MMMU Pro 52.6% - 画像を含むマルチモーダル推論

Codeforces ELO 940 - 競技プログラミング能力

ベンチマーク比較

E4B vs Gemma 4ファミリーおよびGemma 3

Gemma 4 E4Bは優れたエッジ性能を発揮し、より大きなモデルがより高負荷なワークロードに対応します。

Benchmark
Gemma 4 E4B IT
Thinking
注目
Gemma 4 E2B IT
Thinking
Gemma 4 31B IT
Thinking
Gemma 3 27B IT
MMLU Pro
知識と推論
69.4%60.0%85.2%67.6%
AIME 2026
数学
ツールなし
42.5%37.5%89.2%20.8%
GPQA Diamond
科学知識
58.6%43.4%84.3%42.4%
LiveCodeBench v6
競技コーディング
52.0%44.0%80.0%29.1%
Codeforces ELO
競技プログラミング
9406332150-
MMMU Pro
マルチモーダル推論
52.6%44.2%76.9%49.7%
MATH-Vision
視覚数学推論
59.5%52.4%85.6%-
Audio Support
ネイティブ音声入力
YesYesNoNo
Context Window
最大トークン数
128K128K256K128K

ベンチマーク結果はGemma 4公式モデルカードより。E4Bのベンチマークはパラメータ数に対する卓越した効率性を示しています。

ネイティブ音声

文字起こしパイプライン不要の音声理解

Gemma 4 E4Bは、USMスタイルのConformerオーディオエンコーダを内蔵し、音声やオーディオを直接処理します。別途ASRモデルは不要で、音声を入力するだけでインテリジェントな応答が得られます。

  • 約300Mパラメータのconformerオーディオエンコーダをモデルに内蔵
  • 最大30秒のオーディオクリップを直接処理
  • 音声アシスタント、音声分析、アクセシビリティツールに最適
文字起こしパイプライン不要の音声理解

エッジデプロイ

ブラウザからスマートフォン、Raspberry Piまで

Gemma 4 E4Bはあらゆる環境へのデプロイを想定して設計されています。ChromeでWebGPU経由のtransformers.js、スマートフォンでONNX、ノートPCでOllamaで実行可能。4ビット量子化で最小5.5GBのVRAMで動作します。

  • ブラウザ: ChromeでWebGPUアクセラレーション対応のtransformers.js
  • モバイル: iOSおよびAndroidデプロイ向けONNXチェックポイント
  • ローカル: Ollama、llama.cpp、MLXによるプライベートなオンデバイス推論
ブラウザからスマートフォン、Raspberry Piまで

画像とドキュメント

オンデバイスでの画像理解とドキュメント解析

約150Mのビジョンエンコーダが可変アスペクト比と設定可能なトークンバジェットで画像を処理します。優れたOCRとドキュメント理解能力により、オンデバイスでのドキュメント分析を実現します。

  • MMMU Pro マルチモーダル推論で52.6%
  • 可変画像解像度: 画像あたり70-1120トークン
  • オンデバイスでのドキュメント解析、OCR、チャート理解
オンデバイスでの画像理解とドキュメント解析

ウェイトのダウンロード

オンデバイスデプロイ

エッジおよびローカルデプロイ用の公式モデルウェイトをダウンロードできます。

エッジプラットフォーム

ブラウザおよびモバイルデプロイ

エッジデバイス、ブラウザ、モバイルプラットフォームへのデプロイ。

Gemma 4ファミリー

最先端ファミリーのエッジモデル

Gemma 4 E4Bは、Gemma 4ファミリーの推奨エッジモデルです。より高い性能が必要な場合は26B MoEや31B Denseへ、最小フットプリントが必要な場合はE2Bへステップできます。

Gemma 4 E2B

最も厳しいハードウェア制約向けの超コンパクト2.3Bモデル

比較する

Gemma 4 26B

4Bの推論コストで31B級の品質を実現するMoEモデル

詳しく見る

Gemma 4 31B

最高性能を追求するフラッグシップデンスモデル

詳しく見る

ドキュメント

統合とデプロイの完全ガイド

ドキュメントを読む

コミュニティ

Gemmaで開発するデベロッパーに参加

探索する

モデルカード

技術仕様と評価結果

詳細を見る

はじめに

Gemma 4 E4Bでオンデバイスの AI を始めませんか?

無料ですぐにチャットを開始するか、プライベートなオンデバイスデプロイ用にモデルをダウンロードできます。データがデバイスの外に出ることはありません。