Gemma 4 ダウンロード
Gemma 4 公式ウェイトをダウンロード - Apache 2.0ライセンス
Gemma 4の全4モデルがHugging Face、Kaggle、Ollamaからダウンロード可能です。Instruction-tunedとベースの両バリアント、複数の量子化レベル、Apache 2.0による完全な商用利用の自由。
利用可能なモデル
ダウンロード可能な全Gemma 4バリアント
各モデルにはInstruction-tuned(IT)とベースのバリアントがあります。用途に応じて選択:ITはチャットやタスク向け、ベースはファインチューニング向け。
ダウンロードオプション
複数のフォーマットと量子化レベル
モデルはBF16(フル精度)、GGUF(llama.cpp/Ollama向け)、ONNX(エッジデプロイ向け)で利用可能です。4ビットから8ビットの量子化バージョンでメモリ要件を削減できます。
ほとんどのユーザーには、Ollama(ハードウェアに最適な量子化を自動選択)またはHugging FaceのGGUFファイル(llama.cpp向け)がおすすめです。
エッジ - 2.3B有効パラメータ
Gemma 4 E2B
最小モデル。4ビットで3.2GB。スマートフォン、IoT、低予算ハードウェアで動作。
オーディオエンコーダ搭載。メモリが主な制約となる超コンパクトなデプロイに最適。
エッジ - 4.5B有効パラメータ
Gemma 4 E4B
推奨エッジモデル。4ビットで5.5GB。ノートPCやデスクトップに最適な品質。
オーディオエンコーダ搭載。オンデバイスでの強力な推論とコーディング。
サーバー - MoE
Gemma 4 26B A4B
効率的なMoEモデル。4ビットで16GB。4Bの推論コストで31Bに迫る品質。
128エキスパート、8アクティブ+1共有。高スループットの本番サービングに最適。
サーバー - フラッグシップ
Gemma 4 31B
最高品質。4ビットで17GB。Arena AIリーダーボード第3位。
最大の信頼性を実現するDenseアーキテクチャ。品質重視のアプリケーションに最適。
ダウンロード元
公式ダウンロードプラットフォーム
信頼できる公式ソースからダウンロード。すべてのモデルはGoogle DeepMindによって検証・管理されています。
Hugging Face
全バリアント、量子化、ドキュメントを含む完全なモデルリポジトリ。Gemma 4ウェイトの最も包括的なソース。
Kaggle
Google公式のモデルホスティング。ウェイトのダウンロードと実験・ファインチューニング用ノートブックへのアクセス。
Ollama
コマンド1つでダウンロードして実行。Ollamaがハードウェアに最適な量子化を自動選択します。
Google AI Studio
ダウンロード不要。ホストされたAPIを通じてGemma 4をプロトタイピングや開発に利用。
GGUF形式
llama.cppとOllama向けに最適化。Q4_K_MからQ8_0まで、メモリ予算に応じた複数の量子化レベル。
ONNX形式
エッジデバイス、モバイル、ブラウザ向けのクロスプラットフォームデプロイ。多様なハードウェアでの推論に最適化。
クイックダウンロード
最速で始める方法
ダウンロードから実行まで最速のパスはOllamaです。コマンド1つですべて完了します。
Ollamaコマンド
- ollama pull gemma4:e2b - エッジ超コンパクト
- ollama pull gemma4:e4b - エッジ推奨
- ollama pull gemma4:26b - サーバーMoE
- ollama pull gemma4:31b - サーバーフラッグシップ
- ollama run gemma4:e4b - ダウンロードしてすぐチャット開始
Hugging Face CLI
- pip install huggingface_hub
- huggingface-cli download google/gemma-4-e4b-it
- huggingface-cli download google/gemma-4-26b-a4b-it
- huggingface-cli download google/gemma-4-31b-it
- 特定の量子化には --revision を追加
ダウンロードサイズ
モデルと量子化別のファイルサイズ
ストレージとメモリの制約に合った量子化を選択してください。小さい量子化は品質をわずかに犠牲にして、ファイルサイズを大幅に削減します。
E2B 4ビット:約2GBダウンロード、メモリ約3.2GB
E4B 4ビット:約4GBダウンロード、メモリ約5.5GB
26B 4ビット:約10GBダウンロード、メモリ約16GB
31B 4ビット:約12GBダウンロード、メモリ約17GB
サイズ比較
ダウンロードとメモリ要件
全Gemma 4モデルの量子化レベル別ファイルサイズ。
| Benchmark | E2B E2B | E4B E4B | 26B MoE 26B | 31B Dense 31B |
|---|---|---|---|---|
4-bit GGUF 推奨 | ~2 GB | ~4 GB | ~10 GB | ~12 GB |
8-bit GGUF 高品質 | ~5 GB | ~8 GB | ~24 GB | ~29 GB |
BF16 フル精度 | ~10 GB | ~16 GB | ~48 GB | ~58 GB |
VRAM needed 4ビット時 | ~3.2 GB | ~5.5 GB | ~16 GB | ~17 GB |
おおよそのサイズです。実際のダウンロードサイズはソースとフォーマットによって若干異なる場合があります。
複数フォーマット
GGUF、ONNX、SafeTensorsなど
Gemma 4はデプロイ先に応じた複数のフォーマットで利用可能です。llama.cpp/Ollama向けGGUF、エッジデバイス向けONNX、transformers向けSafeTensorsなど。
- GGUF:llama.cpp、Ollama、LM Studio、GPT4All
- ONNX:エッジデバイス、モバイル、ブラウザデプロイ
- SafeTensors:Hugging Face transformers、vLLM、TGI
検証済みソース
公式の検証済みソースからのみダウンロード
すべてのGemma 4ウェイトはGoogle DeepMindが公式プラットフォームで公開しています。正規の未改変ウェイトを確実に入手するため、ダウンロード前に必ず公開元を確認してください。
- Hugging Face:google/ 組織が検証済み
- Kaggle:google/ パブリッシャーが検証済み
- Ollama:公式ライブラリエントリ
公式ソース
検証済みプラットフォームからダウンロード
公式ソースから正規のGemma 4ウェイトを入手。
セットアップガイド
ダウンロード後の実行方法
各デプロイツールのステップバイステップガイド。
ドキュメント
技術リファレンス
全モデルの詳細なドキュメント。
始めましょう
Gemma 4をダウンロードして開発を始めよう
まずオンラインで試すか、プライベートなローカルデプロイのために直接ダウンロード。Apache 2.0ライセンスで完全な商用利用の自由。

