Gemma 4 モデル

4つのモデル、1つのファミリー - エッジからフロンティアまで

Gemma 4 ファミリーは4つのアーキテクチャで構成されています。エッジデバイス向けの超小型 E2B・E4B、効率的なサーバーデプロイ向けの 26B MoE、そしてフラッグシップの 31B Dense。すべてがネイティブマルチモーダル、設定可能な思考機能、Apache 2.0 ライセンスを共有しています。

チャットを始めるベンチマークを比較

全モデル

用途に合った Gemma 4 を選ぶ

ファミリー内の各モデルは、異なるデプロイシナリオに最適化されています。エッジモデルはオーディオに対応し、サーバーモデルは 256K コンテキストとフロンティアクラスの推論を提供します。

エッジモデル

E2B & E4B：オーディオ対応のオンデバイス AI

有効パラメータ 2.3B・4.5B の超小型モデル。ネイティブオーディオエンコーダー、128K コンテキストを搭載し、スマートフォン、ブラウザ、IoT デバイスで動作します。

最小フットプリントなら E2B（4-bit で 3.2GB）。より高品質なら E4B（4-bit で 5.5GB）。どちらもテキスト、画像、動画、オーディオ入力に対応。

E4B を無料で試す E2B vs E4B を比較

サーバーモデル

26B MoE & 31B Dense：フロンティア性能

26B MoE はトークンあたり 4B パラメータのみを活性化し、効率的に処理します。31B Dense は Arena AI ランキング第3位のフラッグシップです。どちらも 256K コンテキストとネイティブ Function Calling を搭載。

高スループットの本番環境には 26B（4-bit で 16GB）。最高品質には 31B（4-bit で 17GB）。どちらも推論、コーディング、マルチモーダルタスクに優れています。

26B を無料で試すベンチマークを見る

エッジ - 超小型

Gemma 4 E2B

有効パラメータ 2.3B。フルマルチモーダル＋オーディオ対応の最小 Gemma 4。

35層、PLE アーキテクチャ、ビジョン約150M＋オーディオエンコーダー約300M。4-bit で VRAM 3.2GB。

提供中

詳細を見るダウンロード

エッジ - おすすめ

Gemma 4 E4B

有効パラメータ 4.5B。優れた推論力とオーディオ対応を備えた最良のエッジモデル。

42層、PLE アーキテクチャ、ビジョン約150M＋オーディオエンコーダー約300M。4-bit で VRAM 5.5GB。

提供中

詳細を見るダウンロード

サーバー - 高効率

Gemma 4 26B A4B

総パラメータ 25.2B、トークンあたり 3.8B 活性化。31B に迫る品質を圧倒的に少ない計算量で実現。

128エキスパートの MoE（8活性化＋1共有）。256K コンテキスト。4-bit で VRAM 16GB。

提供中

詳細を見るダウンロード

サーバー - フラッグシップ

Gemma 4 31B

Dense パラメータ 30.7B。Arena AI 第3位。最高レベルの知性と信頼性。

Dense アーキテクチャ、256K コンテキスト、140以上の言語に対応。4-bit で VRAM 17GB。

提供中

詳細を見るダウンロード

共通機能

すべての Gemma 4 モデルでできること

4つのモデルすべてが、Gemma 4 ファミリーを類まれなく多用途にする共通の機能セットを備えています。

ネイティブマルチモーダル

全モデルがテキストと画像をネイティブに処理。エッジモデルはオーディオと動画にも対応。別途エンコーダーやパイプラインは不要です。

設定可能な思考機能

全モデルがステップバイステップの推論のための思考モードに対応。タスクの複雑さに応じて推論の深さを制御できます。

Function Calling

ファミリー全体に組み込まれた Function Calling でエージェントワークフローを実現。ツール利用にファインチューニングは不要です。

拡張コンテキスト

エッジモデルは 128K トークン、サーバーモデルは 256K トークン。ハイブリッドアテンションでメモリ使用量を実用的に抑えます。

140以上の言語

すべてのモデルサイズで、文化的コンテキストを理解した多言語サポートを提供します。

Apache 2.0 ライセンス

完全な商用利用の自由。MAU 制限なし、利用制限なし。どこにでもデプロイでき、自由に改変できます。

クイック選択ガイド

どのモデルを選ぶべき？

デプロイの制約と品質要件に合った Gemma 4 バリアントを見つけましょう。

ハードウェア別

スマートフォン / IoT / 4GB RAM：Gemma 4 E2B
ノートPC / 8-16GB RAM：Gemma 4 E4B
シングル GPU / 16-24GB VRAM：Gemma 4 26B A4B
マルチ GPU / 24GB以上 VRAM：Gemma 4 31B

用途別

音声アシスタント / オーディオ：E2B または E4B（オーディオ対応）
ブラウザベース AI：E2B または E4B（WebGPU）
高スループット API：26B A4B（MoE の効率性）
最高品質：31B Dense（フロンティア性能）

チャットを始める全ベンチマークを見る

パフォーマンス

全4モデルの完全ベンチマーク比較

Gemma 4 の各モデルはパレートフロンティアを形成し、パラメータ数に対して卓越した性能を発揮します。

超小型の E2B からフラッグシップの 31B まで、各モデルは同じアーキテクチャの革新を共有しながら、それぞれのデプロイ層に最適化されています。

チャットを始めるモデルカードを見る

31B Dense：Arena AI 第3位（ELO 1452）、AIME 2026 89.2%、LiveCodeBench v6 80%

26B MoE：トークンあたり 4B の活性化パラメータで 31B に迫る品質（ELO 1441）

E4B：MMLU Pro 69.4%、LiveCodeBench 52% - オーディオ対応の優れたエッジ性能

E2B：MMLU Pro 60%、LiveCodeBench 44% - VRAM 3.2GB で実用的な AI を実現

ファミリー全体の比較

Gemma 4 全モデルを並べて比較

推論、コーディング、マルチモーダル、デプロイ指標にわたる完全なベンチマーク結果。

Benchmark	31B Dense フラッグシップ 31B	26B A4B MoE 26B	E4B エッジ E4B	E2B コンパクト E2B
Arena AI ELO 総合ランキング	1452	1441	-	-
MMLU Pro 知識と推論	85.2%	82.6%	69.4%	60.0%
AIME 2026 数学	89.2%	88.3%	42.5%	37.5%
LiveCodeBench v6 コーディング	80.0%	77.1%	52.0%	44.0%
GPQA Diamond 科学	84.3%	82.3%	58.6%	43.4%
MMMU Pro マルチモーダル	76.9%	73.8%	52.6%	44.2%
Context Window 最大トークン数	256K	256K	128K	128K
Audio Support ネイティブオーディオ	No	No	Yes	Yes
VRAM (4-bit) 最小メモリ	~17 GB	~16 GB	~5.5 GB	~3.2 GB