Scarica Gemma 4

Scarica i pesi ufficiali di Gemma 4 - Licenza Apache 2.0

Tutti e quattro i modelli Gemma 4 sono disponibili per il download da Hugging Face, Kaggle e Ollama. Varianti Instruction-Tuned e base, diversi livelli di quantizzazione e piena libertà commerciale con Apache 2.0.

Prova prima di scaricare Vedi tutte le varianti

Modelli disponibili

Tutte le varianti Gemma 4 pronte per il download

Ogni modello è disponibile in variante Instruction-Tuned (IT) e base. Scegli in base al tuo caso d'uso: IT per chat e attività, base per il fine-tuning.

Opzioni di download

Diversi formati e livelli di quantizzazione

I modelli sono disponibili in BF16 (precisione piena), GGUF (per llama.cpp/Ollama) e ONNX (per il deployment edge). Le versioni quantizzate da 4 bit a 8 bit riducono i requisiti di memoria.

Per la maggior parte degli utenti, consigliamo Ollama (seleziona automaticamente la quantizzazione giusta) o i file GGUF di Hugging Face per llama.cpp.

Prova prima di scaricare Guida hardware

Edge - 2,3 mld parametri effettivi

Gemma 4 E2B

Il modello più piccolo. 3,2 GB a 4 bit. Funziona su smartphone, IoT e hardware economico.

Include encoder audio. Ideale per deployment ultracompatti dove la memoria è il vincolo principale.

Download da 2 a 10 GB

Hugging Face Ollama

Edge - 4,5 mld parametri effettivi

Gemma 4 E4B

Modello edge consigliato. 5,5 GB a 4 bit. Migliore qualità per laptop e desktop.

Include encoder audio. Ragionamento e programmazione potenti sul dispositivo.

Download da 4 a 16 GB

Hugging Face Ollama

Server - MoE

Gemma 4 26B A4B

Modello MoE efficiente. 16 GB a 4 bit. Qualità vicina al 31B con costo di inferenza di 4B.

128 esperti, 8 attivi + 1 condiviso. Ideale per servizi di produzione ad alto throughput.

Download da 10 a 48 GB

Hugging Face Ollama

Server - Flagship

Gemma 4 31B

Qualità massima. 17 GB a 4 bit. 3° nella classifica Arena AI.

Architettura Dense per la massima affidabilità. Ideale per applicazioni dove la qualità è critica.

Download da 12 a 58 GB

Hugging Face Ollama

Fonti di download

Piattaforme di download ufficiali

Scarica da fonti ufficiali affidabili. Tutti i modelli sono verificati e mantenuti da Google DeepMind.

Hugging Face

Repository completi con tutte le varianti, quantizzazioni e documentazione. La fonte più completa per i pesi Gemma 4.

Kaggle

Hosting ufficiale dei modelli Google. Scarica i pesi e accedi ai notebook per sperimentazione e fine-tuning.

Ollama

Download ed esecuzione con un solo comando. Ollama seleziona automaticamente la quantizzazione giusta per il tuo hardware.

Google AI Studio

Nessun download necessario. Usa Gemma 4 tramite API ospitata per prototipazione e sviluppo.

Formato GGUF

Ottimizzato per llama.cpp e Ollama. Diversi livelli di quantizzazione da Q4_K_M a Q8_0 per diversi budget di memoria.

Formato ONNX

Deployment multipiattaforma per dispositivi edge, mobile e browser. Ottimizzato per l'inferenza su hardware diverso.

Download rapido

Il modo più veloce per iniziare

Usa Ollama per il percorso più rapido dal download all'esecuzione. Un solo comando fa tutto.

Comandi Ollama

ollama pull gemma4:e2b - Edge ultracompatto
ollama pull gemma4:e4b - Edge consigliato
ollama pull gemma4:26b - Server MoE
ollama pull gemma4:31b - Server flagship
ollama run gemma4:e4b - Scarica e inizia a chattare

Hugging Face CLI

pip install huggingface_hub
huggingface-cli download google/gemma-4-e4b-it
huggingface-cli download google/gemma-4-26b-a4b-it
huggingface-cli download google/gemma-4-31b-it
Aggiungi --revision per quantizzazioni specifiche

Prova prima di scaricare Vedi tutti i modelli

Dimensioni di download

Dimensioni dei file per modello e quantizzazione

Scegli la quantizzazione giusta per i tuoi vincoli di archiviazione e memoria. Quantizzazioni più piccole sacrificano un po' di qualità per dimensioni dei file notevolmente ridotte.

Le dimensioni di download variano in base al livello di quantizzazione. La quantizzazione a 4 bit (Q4_K_M) offre il miglior equilibrio tra qualità e dimensione per la maggior parte degli utenti.

Scarica ora Guida hardware

Confronto delle dimensioni di download di Gemma 4 tra modelli e quantizzazioni

E2B a 4 bit: circa 2 GB di download, circa 3,2 GB in memoria

E4B a 4 bit: circa 4 GB di download, circa 5,5 GB in memoria

26B a 4 bit: circa 10 GB di download, circa 16 GB in memoria

31B a 4 bit: circa 12 GB di download, circa 17 GB in memoria

Confronto dimensioni

Requisiti di download e memoria

Dimensioni dei file per diversi livelli di quantizzazione di tutti i modelli Gemma 4.

Benchmark	E2B E2B	E4B E4B	26B MoE 26B	31B Dense 31B
4-bit GGUF Consigliato	~2 GB	~4 GB	~10 GB	~12 GB
8-bit GGUF Qualità superiore	~5 GB	~8 GB	~24 GB	~29 GB
BF16 Precisione piena	~10 GB	~16 GB	~48 GB	~58 GB
VRAM needed A 4 bit	~3.2 GB	~5.5 GB	~16 GB	~17 GB

Dimensioni approssimative. Il download effettivo può variare leggermente in base alla fonte e al formato.

Apache 2.0

Piena libertà commerciale con licenza Apache 2.0

Ogni modello Gemma 4 è rilasciato con licenza Apache 2.0. Nessun limite MAU, nessuna restrizione d'uso, nessuna royalty. Uso commerciale, modifica libera, distribuzione senza limitazioni.

Uso commerciale completo senza restrizioni
Modifica e distribuzione libere
Nessun limite d'uso o obbligo di reportistica

Scarica ora Vedi la licenza

Piena libertà commerciale con licenza Apache 2.0

Formati multipli

GGUF, ONNX, SafeTensors e altro

Gemma 4 è disponibile in diversi formati per diversi target di deployment. GGUF per llama.cpp/Ollama, ONNX per dispositivi edge, SafeTensors per transformers e altro.

GGUF: llama.cpp, Ollama, LM Studio, GPT4All
ONNX: dispositivi edge, mobile, deployment browser
SafeTensors: Hugging Face transformers, vLLM, TGI

Hugging Face Guida ai formati

Fonti verificate

Scarica solo da fonti ufficiali verificate

Tutti i pesi Gemma 4 sono pubblicati da Google DeepMind sulle piattaforme ufficiali. Verifica sempre l'editore prima di scaricare per ottenere pesi autentici e non modificati.

Hugging Face: organizzazione google/ verificata
Kaggle: editore google/ verificato
Ollama: voce ufficiale della libreria

Hugging Face Kaggle