Gemma 4 ダウンロード

Gemma 4 公式ウェイトをダウンロード - Apache 2.0ライセンス

Gemma 4の全4モデルがHugging Face、Kaggle、Ollamaからダウンロード可能です。Instruction-tunedとベースの両バリアント、複数の量子化レベル、Apache 2.0による完全な商用利用の自由。

ダウンロード前に試す全バリアントを見る

利用可能なモデル

ダウンロード可能な全Gemma 4バリアント

各モデルにはInstruction-tuned（IT）とベースのバリアントがあります。用途に応じて選択：ITはチャットやタスク向け、ベースはファインチューニング向け。

ダウンロードオプション

複数のフォーマットと量子化レベル

モデルはBF16（フル精度）、GGUF（llama.cpp/Ollama向け）、ONNX（エッジデプロイ向け）で利用可能です。4ビットから8ビットの量子化バージョンでメモリ要件を削減できます。

ほとんどのユーザーには、Ollama（ハードウェアに最適な量子化を自動選択）またはHugging FaceのGGUFファイル（llama.cpp向け）がおすすめです。

ダウンロード前に試すハードウェアガイド

エッジ - 2.3B有効パラメータ

Gemma 4 E2B

最小モデル。4ビットで3.2GB。スマートフォン、IoT、低予算ハードウェアで動作。

オーディオエンコーダ搭載。メモリが主な制約となる超コンパクトなデプロイに最適。

約2-10 GBのダウンロード

Hugging Face Ollama

エッジ - 4.5B有効パラメータ

Gemma 4 E4B

推奨エッジモデル。4ビットで5.5GB。ノートPCやデスクトップに最適な品質。

オーディオエンコーダ搭載。オンデバイスでの強力な推論とコーディング。

約4-16 GBのダウンロード

Hugging Face Ollama

サーバー - MoE

Gemma 4 26B A4B

効率的なMoEモデル。4ビットで16GB。4Bの推論コストで31Bに迫る品質。

128エキスパート、8アクティブ+1共有。高スループットの本番サービングに最適。

約10-48 GBのダウンロード

Hugging Face Ollama

サーバー - フラッグシップ

Gemma 4 31B

最高品質。4ビットで17GB。Arena AIリーダーボード第3位。

最大の信頼性を実現するDenseアーキテクチャ。品質重視のアプリケーションに最適。

約12-58 GBのダウンロード

Hugging Face Ollama

ダウンロード元

公式ダウンロードプラットフォーム

信頼できる公式ソースからダウンロード。すべてのモデルはGoogle DeepMindによって検証・管理されています。

Hugging Face

全バリアント、量子化、ドキュメントを含む完全なモデルリポジトリ。Gemma 4ウェイトの最も包括的なソース。

Kaggle

Google公式のモデルホスティング。ウェイトのダウンロードと実験・ファインチューニング用ノートブックへのアクセス。

Ollama

コマンド1つでダウンロードして実行。Ollamaがハードウェアに最適な量子化を自動選択します。

Google AI Studio

ダウンロード不要。ホストされたAPIを通じてGemma 4をプロトタイピングや開発に利用。

GGUF形式

llama.cppとOllama向けに最適化。Q4_K_MからQ8_0まで、メモリ予算に応じた複数の量子化レベル。

ONNX形式

エッジデバイス、モバイル、ブラウザ向けのクロスプラットフォームデプロイ。多様なハードウェアでの推論に最適化。

クイックダウンロード

最速で始める方法

ダウンロードから実行まで最速のパスはOllamaです。コマンド1つですべて完了します。

Ollamaコマンド

ollama pull gemma4:e2b - エッジ超コンパクト
ollama pull gemma4:e4b - エッジ推奨
ollama pull gemma4:26b - サーバーMoE
ollama pull gemma4:31b - サーバーフラッグシップ
ollama run gemma4:e4b - ダウンロードしてすぐチャット開始

Hugging Face CLI

pip install huggingface_hub
huggingface-cli download google/gemma-4-e4b-it
huggingface-cli download google/gemma-4-26b-a4b-it
huggingface-cli download google/gemma-4-31b-it
特定の量子化には --revision を追加

ダウンロード前に試す全モデルを見る

ダウンロードサイズ

モデルと量子化別のファイルサイズ

ストレージとメモリの制約に合った量子化を選択してください。小さい量子化は品質をわずかに犠牲にして、ファイルサイズを大幅に削減します。

ダウンロードサイズは量子化レベルによって異なります。4ビット量子化（Q4_K_M）は、ほとんどのユーザーにとって品質とサイズの最適なバランスを提供します。

今すぐダウンロードハードウェアガイド

E2B 4ビット：約2GBダウンロード、メモリ約3.2GB

E4B 4ビット：約4GBダウンロード、メモリ約5.5GB

26B 4ビット：約10GBダウンロード、メモリ約16GB

31B 4ビット：約12GBダウンロード、メモリ約17GB

サイズ比較

ダウンロードとメモリ要件

全Gemma 4モデルの量子化レベル別ファイルサイズ。

Benchmark	E2B E2B	E4B E4B	26B MoE 26B	31B Dense 31B
4-bit GGUF 推奨	~2 GB	~4 GB	~10 GB	~12 GB
8-bit GGUF 高品質	~5 GB	~8 GB	~24 GB	~29 GB
BF16 フル精度	~10 GB	~16 GB	~48 GB	~58 GB
VRAM needed 4ビット時	~3.2 GB	~5.5 GB	~16 GB	~17 GB

おおよそのサイズです。実際のダウンロードサイズはソースとフォーマットによって若干異なる場合があります。

Apache 2.0

Apache 2.0ライセンスによる完全な商用利用の自由

すべてのGemma 4モデルはApache 2.0ライセンスで公開されています。MAU上限なし、利用制限なし、ロイヤリティなし。商用利用、自由な改変、制限なしの配布が可能です。

制限なしの完全な商用利用が可能
自由に改変・配布可能
利用上限や報告義務なし

今すぐダウンロードライセンスを見る

複数フォーマット

GGUF、ONNX、SafeTensorsなど

Gemma 4はデプロイ先に応じた複数のフォーマットで利用可能です。llama.cpp/Ollama向けGGUF、エッジデバイス向けONNX、transformers向けSafeTensorsなど。

GGUF：llama.cpp、Ollama、LM Studio、GPT4All
ONNX：エッジデバイス、モバイル、ブラウザデプロイ
SafeTensors：Hugging Face transformers、vLLM、TGI

Hugging Face フォーマットガイド

検証済みソース

公式の検証済みソースからのみダウンロード

すべてのGemma 4ウェイトはGoogle DeepMindが公式プラットフォームで公開しています。正規の未改変ウェイトを確実に入手するため、ダウンロード前に必ず公開元を確認してください。

Hugging Face：google/ 組織が検証済み
Kaggle：google/ パブリッシャーが検証済み
Ollama：公式ライブラリエントリ

Hugging Face Kaggle

公式ソース

検証済みプラットフォームからダウンロード

公式ソースから正規のGemma 4ウェイトを入手。

全モデル、全フォーマット、全量子化

Google公式モデルホスティング

コマンド1つでダウンロードして実行

ダウンロード不要 - API経由で利用

セットアップガイド

ダウンロード後の実行方法

各デプロイツールのステップバイステップガイド。

Ollama セットアップ

ローカルGemma 4への最も簡単な方法

llama.cpp セットアップ

パワーユーザー向けの最大限のコントロール

MLX セットアップ

Apple Silicon向けに最適化

ドキュメント

技術リファレンス

全モデルの詳細なドキュメント。

モデルカード

完全な技術仕様

APIドキュメント

Gemini APIとVertex AIガイド

ファインチューニングガイド

ユースケースに合わせてカスタマイズ

ハードウェアガイド

ハードウェアに最適なモデルを選択

ダウンロード後

Gemma 4ウェイトの活用方法

ウェイトをダウンロードしましたか？次にできることはこちらです。

ローカルで実行全モデルを見る

ローカル実行

ローカルデプロイの完全ガイド

ガイドを読む

APIアクセス

ホストされたAPIで代わりに利用

始める

ファインチューニング

特定のタスクに合わせてカスタマイズ

詳しく見る

全モデル

全Gemma 4バリアントを比較

比較する

コミュニティ

Gemmaで開発する仲間に参加

探索する

モデルカード

技術仕様

見る

始めましょう

Gemma 4をダウンロードして開発を始めよう

まずオンラインで試すか、プライベートなローカルデプロイのために直接ダウンロード。Apache 2.0ライセンスで完全な商用利用の自由。

まずオンラインで試す Hugging Faceからダウンロード

Gemma 4 公式ウェイトをダウンロード - Apache 2.0ライセンス

お使いのハードウェアに最適なモデルを選ぶ

ダウンロード可能な全Gemma 4バリアント

複数のフォーマットと量子化レベル

Gemma 4 E2B

Gemma 4 E4B

Gemma 4 26B A4B

Gemma 4 31B

公式ダウンロードプラットフォーム

Hugging Face

Kaggle

Ollama

Google AI Studio

GGUF形式

ONNX形式

最速で始める方法

モデルと量子化別のファイルサイズ

ダウンロードとメモリ要件

Apache 2.0ライセンスによる完全な商用利用の自由

GGUF、ONNX、SafeTensorsなど

公式の検証済みソースからのみダウンロード

検証済みプラットフォームからダウンロード

ダウンロード後の実行方法

技術リファレンス

Gemma 4ウェイトの活用方法

ローカル実行

APIアクセス

ファインチューニング

全モデル

コミュニティ

モデルカード

Gemma 4をダウンロードして開発を始めよう