全モデル
用途に合った Gemma 4 を選ぶ
ファミリー内の各モデルは、異なるデプロイシナリオに最適化されています。エッジモデルはオーディオに対応し、サーバーモデルは 256K コンテキストとフロンティアクラスの推論を提供します。
エッジモデル
E2B & E4B:オーディオ対応のオンデバイス AI
有効パラメータ 2.3B・4.5B の超小型モデル。ネイティブオーディオエンコーダー、128K コンテキストを搭載し、スマートフォン、ブラウザ、IoT デバイスで動作します。
最小フットプリントなら E2B(4-bit で 3.2GB)。より高品質なら E4B(4-bit で 5.5GB)。どちらもテキスト、画像、動画、オーディオ入力に対応。
サーバーモデル
26B MoE & 31B Dense:フロンティア性能
26B MoE はトークンあたり 4B パラメータのみを活性化し、効率的に処理します。31B Dense は Arena AI ランキング第3位のフラッグシップです。どちらも 256K コンテキストとネイティブ Function Calling を搭載。
高スループットの本番環境には 26B(4-bit で 16GB)。最高品質には 31B(4-bit で 17GB)。どちらも推論、コーディング、マルチモーダルタスクに優れています。
エッジ - 超小型
Gemma 4 E2B
有効パラメータ 2.3B。フルマルチモーダル+オーディオ対応の最小 Gemma 4。
35層、PLE アーキテクチャ、ビジョン約150M+オーディオエンコーダー約300M。4-bit で VRAM 3.2GB。
エッジ - おすすめ
Gemma 4 E4B
有効パラメータ 4.5B。優れた推論力とオーディオ対応を備えた最良のエッジモデル。
42層、PLE アーキテクチャ、ビジョン約150M+オーディオエンコーダー約300M。4-bit で VRAM 5.5GB。
サーバー - 高効率
Gemma 4 26B A4B
総パラメータ 25.2B、トークンあたり 3.8B 活性化。31B に迫る品質を圧倒的に少ない計算量で実現。
128エキスパートの MoE(8活性化+1共有)。256K コンテキスト。4-bit で VRAM 16GB。
共通機能
すべての Gemma 4 モデルでできること
4つのモデルすべてが、Gemma 4 ファミリーを類まれなく多用途にする共通の機能セットを備えています。
ネイティブマルチモーダル
全モデルがテキストと画像をネイティブに処理。エッジモデルはオーディオと動画にも対応。別途エンコーダーやパイプラインは不要です。
設定可能な思考機能
全モデルがステップバイステップの推論のための思考モードに対応。タスクの複雑さに応じて推論の深さを制御できます。
Function Calling
ファミリー全体に組み込まれた Function Calling でエージェントワークフローを実現。ツール利用にファインチューニングは不要です。
拡張コンテキスト
エッジモデルは 128K トークン、サーバーモデルは 256K トークン。ハイブリッドアテンションでメモリ使用量を実用的に抑えます。
140以上の言語
すべてのモデルサイズで、文化的コンテキストを理解した多言語サポートを提供します。
Apache 2.0 ライセンス
完全な商用利用の自由。MAU 制限なし、利用制限なし。どこにでもデプロイでき、自由に改変できます。
クイック選択ガイド
どのモデルを選ぶべき?
デプロイの制約と品質要件に合った Gemma 4 バリアントを見つけましょう。
ハードウェア別
- スマートフォン / IoT / 4GB RAM:Gemma 4 E2B
- ノートPC / 8-16GB RAM:Gemma 4 E4B
- シングル GPU / 16-24GB VRAM:Gemma 4 26B A4B
- マルチ GPU / 24GB以上 VRAM:Gemma 4 31B
用途別
- 音声アシスタント / オーディオ:E2B または E4B(オーディオ対応)
- ブラウザベース AI:E2B または E4B(WebGPU)
- 高スループット API:26B A4B(MoE の効率性)
- 最高品質:31B Dense(フロンティア性能)
パフォーマンス
全4モデルの完全ベンチマーク比較
Gemma 4 の各モデルはパレートフロンティアを形成し、パラメータ数に対して卓越した性能を発揮します。
31B Dense:Arena AI 第3位(ELO 1452)、AIME 2026 89.2%、LiveCodeBench v6 80%
26B MoE:トークンあたり 4B の活性化パラメータで 31B に迫る品質(ELO 1441)
E4B:MMLU Pro 69.4%、LiveCodeBench 52% - オーディオ対応の優れたエッジ性能
E2B:MMLU Pro 60%、LiveCodeBench 44% - VRAM 3.2GB で実用的な AI を実現
ファミリー全体の比較
Gemma 4 全モデルを並べて比較
推論、コーディング、マルチモーダル、デプロイ指標にわたる完全なベンチマーク結果。
| Benchmark | 31B Dense フラッグシップ 31B | 26B A4B MoE 26B | E4B エッジ E4B | E2B コンパクト E2B |
|---|---|---|---|---|
Arena AI ELO 総合ランキング | 1452 | 1441 | - | - |
MMLU Pro 知識と推論 | 85.2% | 82.6% | 69.4% | 60.0% |
AIME 2026 数学 | 89.2% | 88.3% | 42.5% | 37.5% |
LiveCodeBench v6 コーディング | 80.0% | 77.1% | 52.0% | 44.0% |
GPQA Diamond 科学 | 84.3% | 82.3% | 58.6% | 43.4% |
MMMU Pro マルチモーダル | 76.9% | 73.8% | 52.6% | 44.2% |
Context Window 最大トークン数 | 256K | 256K | 128K | 128K |
Audio Support ネイティブオーディオ | No | No | Yes | Yes |
VRAM (4-bit) 最小メモリ | ~17 GB | ~16 GB | ~5.5 GB | ~3.2 GB |
すべての数値は Gemma 4 公式モデルカードより。Arena AI スコアは2026年4月2日時点。
エッジ層
E2B & E4B:デバイス上で動く AI
エッジモデルは、スマートフォン、ブラウザ、IoT デバイスにフルマルチモーダル AI をもたらします。どちらもネイティブオーディオエンコーダーを搭載 - 大型モデルにはない機能です。最小フットプリントなら E2B、より高品質なら E4B を選びましょう。
- E2B:有効パラメータ 2.3B、4-bit で 3.2GB、コンシューマーハードウェアで 95 tok/s
- E4B:有効パラメータ 4.5B、4-bit で 5.5GB、優れた推論力とコーディング性能
- 共通:ネイティブオーディオ、128K コンテキスト、WebGPU ブラウザ対応
サーバー層
26B MoE & 31B Dense:フロンティア性能
サーバーモデルは、フロンティアクラスの推論、コーディング、マルチモーダル理解を提供します。26B MoE は 31B に迫る品質を圧倒的に少ない計算量で実現。31B Dense は最高性能のフラッグシップです。
- 26B MoE:トークンあたり 3.8B 活性化、ELO 1441、AIME 2026 88.3%
- 31B Dense:全 30.7B 活性化、ELO 1452、AIME 2026 89.2%
- 共通:256K コンテキスト、ネイティブ Function Calling、140以上の言語
今すぐ試す
Gemma 4 の全モデルとチャット
チャットインターフェースですべてのモデルをすぐに試せます。ローカルデプロイ用のダウンロードも可能です。
ダウンロード
モデルウェイトを取得
Gemma 4 全バリアントの公式ウェイトをダウンロード。
デプロイ
本番デプロイ
クラウド、ローカル、エッジプラットフォームにデプロイ。
Gemma 4 ファミリー
各モデルを詳しく見る
アーキテクチャ、ベンチマーク、デプロイガイドを網羅した専用ページで、各 Gemma 4 バリアントを深く掘り下げましょう。
始めましょう
あなたに合った Gemma 4 モデルを見つけよう
Gemma 4 の全モデルと無料でチャット、またはローカルデプロイ用にウェイトをダウンロード。Apache 2.0 ライセンスで商用利用も完全に自由です。

