Gemma 4 ダウンロード

Gemma 4 公式ウェイトをダウンロード - Apache 2.0ライセンス

Gemma 4の全4モデルがHugging Face、Kaggle、Ollamaからダウンロード可能です。Instruction-tunedとベースの両バリアント、複数の量子化レベル、Apache 2.0による完全な商用利用の自由。

利用可能なモデル

ダウンロード可能な全Gemma 4バリアント

各モデルにはInstruction-tuned(IT)とベースのバリアントがあります。用途に応じて選択:ITはチャットやタスク向け、ベースはファインチューニング向け。

ダウンロードオプション

複数のフォーマットと量子化レベル

モデルはBF16(フル精度)、GGUF(llama.cpp/Ollama向け)、ONNX(エッジデプロイ向け)で利用可能です。4ビットから8ビットの量子化バージョンでメモリ要件を削減できます。

ほとんどのユーザーには、Ollama(ハードウェアに最適な量子化を自動選択)またはHugging FaceのGGUFファイル(llama.cpp向け)がおすすめです。

エッジ - 2.3B有効パラメータ

Gemma 4 E2B

最小モデル。4ビットで3.2GB。スマートフォン、IoT、低予算ハードウェアで動作。

オーディオエンコーダ搭載。メモリが主な制約となる超コンパクトなデプロイに最適。

約2-10 GBのダウンロード

エッジ - 4.5B有効パラメータ

Gemma 4 E4B

推奨エッジモデル。4ビットで5.5GB。ノートPCやデスクトップに最適な品質。

オーディオエンコーダ搭載。オンデバイスでの強力な推論とコーディング。

約4-16 GBのダウンロード

サーバー - MoE

Gemma 4 26B A4B

効率的なMoEモデル。4ビットで16GB。4Bの推論コストで31Bに迫る品質。

128エキスパート、8アクティブ+1共有。高スループットの本番サービングに最適。

約10-48 GBのダウンロード

サーバー - フラッグシップ

Gemma 4 31B

最高品質。4ビットで17GB。Arena AIリーダーボード第3位。

最大の信頼性を実現するDenseアーキテクチャ。品質重視のアプリケーションに最適。

約12-58 GBのダウンロード

ダウンロード元

公式ダウンロードプラットフォーム

信頼できる公式ソースからダウンロード。すべてのモデルはGoogle DeepMindによって検証・管理されています。

Hugging Face

全バリアント、量子化、ドキュメントを含む完全なモデルリポジトリ。Gemma 4ウェイトの最も包括的なソース。

Kaggle

Google公式のモデルホスティング。ウェイトのダウンロードと実験・ファインチューニング用ノートブックへのアクセス。

Ollama

コマンド1つでダウンロードして実行。Ollamaがハードウェアに最適な量子化を自動選択します。

Google AI Studio

ダウンロード不要。ホストされたAPIを通じてGemma 4をプロトタイピングや開発に利用。

GGUF形式

llama.cppとOllama向けに最適化。Q4_K_MからQ8_0まで、メモリ予算に応じた複数の量子化レベル。

ONNX形式

エッジデバイス、モバイル、ブラウザ向けのクロスプラットフォームデプロイ。多様なハードウェアでの推論に最適化。

クイックダウンロード

最速で始める方法

ダウンロードから実行まで最速のパスはOllamaです。コマンド1つですべて完了します。

Ollamaコマンド

  • ollama pull gemma4:e2b - エッジ超コンパクト
  • ollama pull gemma4:e4b - エッジ推奨
  • ollama pull gemma4:26b - サーバーMoE
  • ollama pull gemma4:31b - サーバーフラッグシップ
  • ollama run gemma4:e4b - ダウンロードしてすぐチャット開始

Hugging Face CLI

  • pip install huggingface_hub
  • huggingface-cli download google/gemma-4-e4b-it
  • huggingface-cli download google/gemma-4-26b-a4b-it
  • huggingface-cli download google/gemma-4-31b-it
  • 特定の量子化には --revision を追加

ダウンロードサイズ

モデルと量子化別のファイルサイズ

ストレージとメモリの制約に合った量子化を選択してください。小さい量子化は品質をわずかに犠牲にして、ファイルサイズを大幅に削減します。

ダウンロードサイズは量子化レベルによって異なります。4ビット量子化(Q4_K_M)は、ほとんどのユーザーにとって品質とサイズの最適なバランスを提供します。

Gemma 4のモデルと量子化別ダウンロードサイズ比較チャート

E2B 4ビット:約2GBダウンロード、メモリ約3.2GB

E4B 4ビット:約4GBダウンロード、メモリ約5.5GB

26B 4ビット:約10GBダウンロード、メモリ約16GB

31B 4ビット:約12GBダウンロード、メモリ約17GB

サイズ比較

ダウンロードとメモリ要件

全Gemma 4モデルの量子化レベル別ファイルサイズ。

Benchmark
E2B
E2B
E4B
E4B
26B MoE
26B
31B Dense
31B
4-bit GGUF
推奨
~2 GB~4 GB~10 GB~12 GB
8-bit GGUF
高品質
~5 GB~8 GB~24 GB~29 GB
BF16
フル精度
~10 GB~16 GB~48 GB~58 GB
VRAM needed
4ビット時
~3.2 GB~5.5 GB~16 GB~17 GB

おおよそのサイズです。実際のダウンロードサイズはソースとフォーマットによって若干異なる場合があります。

Apache 2.0

Apache 2.0ライセンスによる完全な商用利用の自由

すべてのGemma 4モデルはApache 2.0ライセンスで公開されています。MAU上限なし、利用制限なし、ロイヤリティなし。商用利用、自由な改変、制限なしの配布が可能です。

  • 制限なしの完全な商用利用が可能
  • 自由に改変・配布可能
  • 利用上限や報告義務なし
Apache 2.0ライセンスによる完全な商用利用の自由

複数フォーマット

GGUF、ONNX、SafeTensorsなど

Gemma 4はデプロイ先に応じた複数のフォーマットで利用可能です。llama.cpp/Ollama向けGGUF、エッジデバイス向けONNX、transformers向けSafeTensorsなど。

  • GGUF:llama.cpp、Ollama、LM Studio、GPT4All
  • ONNX:エッジデバイス、モバイル、ブラウザデプロイ
  • SafeTensors:Hugging Face transformers、vLLM、TGI
GGUF、ONNX、SafeTensorsなど

検証済みソース

公式の検証済みソースからのみダウンロード

すべてのGemma 4ウェイトはGoogle DeepMindが公式プラットフォームで公開しています。正規の未改変ウェイトを確実に入手するため、ダウンロード前に必ず公開元を確認してください。

  • Hugging Face:google/ 組織が検証済み
  • Kaggle:google/ パブリッシャーが検証済み
  • Ollama:公式ライブラリエントリ
公式の検証済みソースからのみダウンロード

ダウンロード後

Gemma 4ウェイトの活用方法

ウェイトをダウンロードしましたか?次にできることはこちらです。

ローカル実行

ローカルデプロイの完全ガイド

ガイドを読む

APIアクセス

ホストされたAPIで代わりに利用

始める

ファインチューニング

特定のタスクに合わせてカスタマイズ

詳しく見る

全モデル

全Gemma 4バリアントを比較

比較する

コミュニティ

Gemmaで開発する仲間に参加

探索する

モデルカード

技術仕様

見る

始めましょう

Gemma 4をダウンロードして開発を始めよう

まずオンラインで試すか、プライベートなローカルデプロイのために直接ダウンロード。Apache 2.0ライセンスで完全な商用利用の自由。