Gemma 4 モデル

4つのモデル、1つのファミリー - エッジからフロンティアまで

Gemma 4 ファミリーは4つのアーキテクチャで構成されています。エッジデバイス向けの超小型 E2B・E4B、効率的なサーバーデプロイ向けの 26B MoE、そしてフラッグシップの 31B Dense。すべてがネイティブマルチモーダル、設定可能な思考機能、Apache 2.0 ライセンスを共有しています。

全モデル

用途に合った Gemma 4 を選ぶ

ファミリー内の各モデルは、異なるデプロイシナリオに最適化されています。エッジモデルはオーディオに対応し、サーバーモデルは 256K コンテキストとフロンティアクラスの推論を提供します。

エッジモデル

E2B & E4B:オーディオ対応のオンデバイス AI

有効パラメータ 2.3B・4.5B の超小型モデル。ネイティブオーディオエンコーダー、128K コンテキストを搭載し、スマートフォン、ブラウザ、IoT デバイスで動作します。

最小フットプリントなら E2B(4-bit で 3.2GB)。より高品質なら E4B(4-bit で 5.5GB)。どちらもテキスト、画像、動画、オーディオ入力に対応。

サーバーモデル

26B MoE & 31B Dense:フロンティア性能

26B MoE はトークンあたり 4B パラメータのみを活性化し、効率的に処理します。31B Dense は Arena AI ランキング第3位のフラッグシップです。どちらも 256K コンテキストとネイティブ Function Calling を搭載。

高スループットの本番環境には 26B(4-bit で 16GB)。最高品質には 31B(4-bit で 17GB)。どちらも推論、コーディング、マルチモーダルタスクに優れています。

エッジ - 超小型

Gemma 4 E2B

有効パラメータ 2.3B。フルマルチモーダル+オーディオ対応の最小 Gemma 4。

35層、PLE アーキテクチャ、ビジョン約150M+オーディオエンコーダー約300M。4-bit で VRAM 3.2GB。

提供中

エッジ - おすすめ

Gemma 4 E4B

有効パラメータ 4.5B。優れた推論力とオーディオ対応を備えた最良のエッジモデル。

42層、PLE アーキテクチャ、ビジョン約150M+オーディオエンコーダー約300M。4-bit で VRAM 5.5GB。

提供中

サーバー - 高効率

Gemma 4 26B A4B

総パラメータ 25.2B、トークンあたり 3.8B 活性化。31B に迫る品質を圧倒的に少ない計算量で実現。

128エキスパートの MoE(8活性化+1共有)。256K コンテキスト。4-bit で VRAM 16GB。

提供中

サーバー - フラッグシップ

Gemma 4 31B

Dense パラメータ 30.7B。Arena AI 第3位。最高レベルの知性と信頼性。

Dense アーキテクチャ、256K コンテキスト、140以上の言語に対応。4-bit で VRAM 17GB。

提供中

共通機能

すべての Gemma 4 モデルでできること

4つのモデルすべてが、Gemma 4 ファミリーを類まれなく多用途にする共通の機能セットを備えています。

ネイティブマルチモーダル

全モデルがテキストと画像をネイティブに処理。エッジモデルはオーディオと動画にも対応。別途エンコーダーやパイプラインは不要です。

設定可能な思考機能

全モデルがステップバイステップの推論のための思考モードに対応。タスクの複雑さに応じて推論の深さを制御できます。

Function Calling

ファミリー全体に組み込まれた Function Calling でエージェントワークフローを実現。ツール利用にファインチューニングは不要です。

拡張コンテキスト

エッジモデルは 128K トークン、サーバーモデルは 256K トークン。ハイブリッドアテンションでメモリ使用量を実用的に抑えます。

140以上の言語

すべてのモデルサイズで、文化的コンテキストを理解した多言語サポートを提供します。

Apache 2.0 ライセンス

完全な商用利用の自由。MAU 制限なし、利用制限なし。どこにでもデプロイでき、自由に改変できます。

クイック選択ガイド

どのモデルを選ぶべき?

デプロイの制約と品質要件に合った Gemma 4 バリアントを見つけましょう。

ハードウェア別

  • スマートフォン / IoT / 4GB RAM:Gemma 4 E2B
  • ノートPC / 8-16GB RAM:Gemma 4 E4B
  • シングル GPU / 16-24GB VRAM:Gemma 4 26B A4B
  • マルチ GPU / 24GB以上 VRAM:Gemma 4 31B

用途別

  • 音声アシスタント / オーディオ:E2B または E4B(オーディオ対応)
  • ブラウザベース AI:E2B または E4B(WebGPU)
  • 高スループット API:26B A4B(MoE の効率性)
  • 最高品質:31B Dense(フロンティア性能)

パフォーマンス

全4モデルの完全ベンチマーク比較

Gemma 4 の各モデルはパレートフロンティアを形成し、パラメータ数に対して卓越した性能を発揮します。

超小型の E2B からフラッグシップの 31B まで、各モデルは同じアーキテクチャの革新を共有しながら、それぞれのデプロイ層に最適化されています。

Gemma 4 ファミリーの全モデルサイズにわたるパフォーマンス比較

31B Dense:Arena AI 第3位(ELO 1452)、AIME 2026 89.2%、LiveCodeBench v6 80%

26B MoE:トークンあたり 4B の活性化パラメータで 31B に迫る品質(ELO 1441)

E4B:MMLU Pro 69.4%、LiveCodeBench 52% - オーディオ対応の優れたエッジ性能

E2B:MMLU Pro 60%、LiveCodeBench 44% - VRAM 3.2GB で実用的な AI を実現

ファミリー全体の比較

Gemma 4 全モデルを並べて比較

推論、コーディング、マルチモーダル、デプロイ指標にわたる完全なベンチマーク結果。

Benchmark
31B Dense
フラッグシップ
31B
26B A4B
MoE
26B
E4B
エッジ
E4B
E2B
コンパクト
E2B
Arena AI ELO
総合ランキング
14521441--
MMLU Pro
知識と推論
85.2%82.6%69.4%60.0%
AIME 2026
数学
89.2%88.3%42.5%37.5%
LiveCodeBench v6
コーディング
80.0%77.1%52.0%44.0%
GPQA Diamond
科学
84.3%82.3%58.6%43.4%
MMMU Pro
マルチモーダル
76.9%73.8%52.6%44.2%
Context Window
最大トークン数
256K256K128K128K
Audio Support
ネイティブオーディオ
NoNoYesYes
VRAM (4-bit)
最小メモリ
~17 GB~16 GB~5.5 GB~3.2 GB

すべての数値は Gemma 4 公式モデルカードより。Arena AI スコアは2026年4月2日時点。

エッジ層

E2B & E4B:デバイス上で動く AI

エッジモデルは、スマートフォン、ブラウザ、IoT デバイスにフルマルチモーダル AI をもたらします。どちらもネイティブオーディオエンコーダーを搭載 - 大型モデルにはない機能です。最小フットプリントなら E2B、より高品質なら E4B を選びましょう。

  • E2B:有効パラメータ 2.3B、4-bit で 3.2GB、コンシューマーハードウェアで 95 tok/s
  • E4B:有効パラメータ 4.5B、4-bit で 5.5GB、優れた推論力とコーディング性能
  • 共通:ネイティブオーディオ、128K コンテキスト、WebGPU ブラウザ対応
E2B & E4B:デバイス上で動く AI

サーバー層

26B MoE & 31B Dense:フロンティア性能

サーバーモデルは、フロンティアクラスの推論、コーディング、マルチモーダル理解を提供します。26B MoE は 31B に迫る品質を圧倒的に少ない計算量で実現。31B Dense は最高性能のフラッグシップです。

  • 26B MoE:トークンあたり 3.8B 活性化、ELO 1441、AIME 2026 88.3%
  • 31B Dense:全 30.7B 活性化、ELO 1452、AIME 2026 89.2%
  • 共通:256K コンテキスト、ネイティブ Function Calling、140以上の言語
26B MoE & 31B Dense:フロンティア性能

アーキテクチャ

ファミリー全体で共有される革新技術

すべての Gemma 4 モデルは、Google DeepMind の研究による主要なアーキテクチャの革新を共有しています。Per-Layer Embeddings、共有 KV キャッシュ、ハイブリッドアテンションパターンが、あらゆるスケールで効率を最大化します。

  • Per-Layer Embeddings(PLE)によるパラメータ効率の高い条件付け
  • 共有 KV キャッシュでロングコンテキスト生成時のメモリを削減
  • ハイブリッドローカル/グローバルアテンションで最適なメモリ・品質のトレードオフ
ファミリー全体で共有される革新技術

Gemma 4 ファミリー

各モデルを詳しく見る

アーキテクチャ、ベンチマーク、デプロイガイドを網羅した専用ページで、各 Gemma 4 バリアントを深く掘り下げましょう。

Gemma 4 E2B

オーディオ対応の超小型 2.3B エッジモデル

詳しく見る

Gemma 4 E4B

オーディオ対応のおすすめ 4.5B エッジモデル

詳しく見る

Gemma 4 26B

4B 活性化パラメータの高効率 MoE

詳しく見る

Gemma 4 31B

Arena AI 第3位のフラッグシップ Dense モデル

詳しく見る

ローカル実行

お使いのハードウェアで Gemma 4 を実行するガイド

ガイドを読む

API アクセス

ホスト型 API で Gemma 4 を利用

始める

始めましょう

あなたに合った Gemma 4 モデルを見つけよう

Gemma 4 の全モデルと無料でチャット、またはローカルデプロイ用にウェイトをダウンロード。Apache 2.0 ライセンスで商用利用も完全に自由です。