Scarica Gemma 4
Scarica i pesi ufficiali di Gemma 4 - Licenza Apache 2.0
Tutti e quattro i modelli Gemma 4 sono disponibili per il download da Hugging Face, Kaggle e Ollama. Varianti Instruction-Tuned e base, diversi livelli di quantizzazione e piena libertà commerciale con Apache 2.0.
Modelli disponibili
Tutte le varianti Gemma 4 pronte per il download
Ogni modello è disponibile in variante Instruction-Tuned (IT) e base. Scegli in base al tuo caso d'uso: IT per chat e attività, base per il fine-tuning.
Opzioni di download
Diversi formati e livelli di quantizzazione
I modelli sono disponibili in BF16 (precisione piena), GGUF (per llama.cpp/Ollama) e ONNX (per il deployment edge). Le versioni quantizzate da 4 bit a 8 bit riducono i requisiti di memoria.
Per la maggior parte degli utenti, consigliamo Ollama (seleziona automaticamente la quantizzazione giusta) o i file GGUF di Hugging Face per llama.cpp.
Edge - 2,3 mld parametri effettivi
Gemma 4 E2B
Il modello più piccolo. 3,2 GB a 4 bit. Funziona su smartphone, IoT e hardware economico.
Include encoder audio. Ideale per deployment ultracompatti dove la memoria è il vincolo principale.
Edge - 4,5 mld parametri effettivi
Gemma 4 E4B
Modello edge consigliato. 5,5 GB a 4 bit. Migliore qualità per laptop e desktop.
Include encoder audio. Ragionamento e programmazione potenti sul dispositivo.
Server - MoE
Gemma 4 26B A4B
Modello MoE efficiente. 16 GB a 4 bit. Qualità vicina al 31B con costo di inferenza di 4B.
128 esperti, 8 attivi + 1 condiviso. Ideale per servizi di produzione ad alto throughput.
Server - Flagship
Gemma 4 31B
Qualità massima. 17 GB a 4 bit. 3° nella classifica Arena AI.
Architettura Dense per la massima affidabilità. Ideale per applicazioni dove la qualità è critica.
Fonti di download
Piattaforme di download ufficiali
Scarica da fonti ufficiali affidabili. Tutti i modelli sono verificati e mantenuti da Google DeepMind.
Hugging Face
Repository completi con tutte le varianti, quantizzazioni e documentazione. La fonte più completa per i pesi Gemma 4.
Kaggle
Hosting ufficiale dei modelli Google. Scarica i pesi e accedi ai notebook per sperimentazione e fine-tuning.
Ollama
Download ed esecuzione con un solo comando. Ollama seleziona automaticamente la quantizzazione giusta per il tuo hardware.
Google AI Studio
Nessun download necessario. Usa Gemma 4 tramite API ospitata per prototipazione e sviluppo.
Formato GGUF
Ottimizzato per llama.cpp e Ollama. Diversi livelli di quantizzazione da Q4_K_M a Q8_0 per diversi budget di memoria.
Formato ONNX
Deployment multipiattaforma per dispositivi edge, mobile e browser. Ottimizzato per l'inferenza su hardware diverso.
Download rapido
Il modo più veloce per iniziare
Usa Ollama per il percorso più rapido dal download all'esecuzione. Un solo comando fa tutto.
Comandi Ollama
- ollama pull gemma4:e2b - Edge ultracompatto
- ollama pull gemma4:e4b - Edge consigliato
- ollama pull gemma4:26b - Server MoE
- ollama pull gemma4:31b - Server flagship
- ollama run gemma4:e4b - Scarica e inizia a chattare
Hugging Face CLI
- pip install huggingface_hub
- huggingface-cli download google/gemma-4-e4b-it
- huggingface-cli download google/gemma-4-26b-a4b-it
- huggingface-cli download google/gemma-4-31b-it
- Aggiungi --revision per quantizzazioni specifiche
Dimensioni di download
Dimensioni dei file per modello e quantizzazione
Scegli la quantizzazione giusta per i tuoi vincoli di archiviazione e memoria. Quantizzazioni più piccole sacrificano un po' di qualità per dimensioni dei file notevolmente ridotte.
Le dimensioni di download variano in base al livello di quantizzazione. La quantizzazione a 4 bit (Q4_K_M) offre il miglior equilibrio tra qualità e dimensione per la maggior parte degli utenti.


E2B a 4 bit: circa 2 GB di download, circa 3,2 GB in memoria
E4B a 4 bit: circa 4 GB di download, circa 5,5 GB in memoria
26B a 4 bit: circa 10 GB di download, circa 16 GB in memoria
31B a 4 bit: circa 12 GB di download, circa 17 GB in memoria
Confronto dimensioni
Requisiti di download e memoria
Dimensioni dei file per diversi livelli di quantizzazione di tutti i modelli Gemma 4.
| Benchmark | E2B E2B | E4B E4B | 26B MoE 26B | 31B Dense 31B |
|---|---|---|---|---|
4-bit GGUF Consigliato | ~2 GB | ~4 GB | ~10 GB | ~12 GB |
8-bit GGUF Qualità superiore | ~5 GB | ~8 GB | ~24 GB | ~29 GB |
BF16 Precisione piena | ~10 GB | ~16 GB | ~48 GB | ~58 GB |
VRAM needed A 4 bit | ~3.2 GB | ~5.5 GB | ~16 GB | ~17 GB |
Dimensioni approssimative. Il download effettivo può variare leggermente in base alla fonte e al formato.
Apache 2.0
Piena libertà commerciale con licenza Apache 2.0
Ogni modello Gemma 4 è rilasciato con licenza Apache 2.0. Nessun limite MAU, nessuna restrizione d'uso, nessuna royalty. Uso commerciale, modifica libera, distribuzione senza limitazioni.
- Uso commerciale completo senza restrizioni
- Modifica e distribuzione libere
- Nessun limite d'uso o obbligo di reportistica
Formati multipli
GGUF, ONNX, SafeTensors e altro
Gemma 4 è disponibile in diversi formati per diversi target di deployment. GGUF per llama.cpp/Ollama, ONNX per dispositivi edge, SafeTensors per transformers e altro.
- GGUF: llama.cpp, Ollama, LM Studio, GPT4All
- ONNX: dispositivi edge, mobile, deployment browser
- SafeTensors: Hugging Face transformers, vLLM, TGI
Fonti verificate
Scarica solo da fonti ufficiali verificate
Tutti i pesi Gemma 4 sono pubblicati da Google DeepMind sulle piattaforme ufficiali. Verifica sempre l'editore prima di scaricare per ottenere pesi autentici e non modificati.
- Hugging Face: organizzazione google/ verificata
- Kaggle: editore google/ verificato
- Ollama: voce ufficiale della libreria
Fonti ufficiali
Scarica da piattaforme verificate
Ottieni pesi Gemma 4 autentici dalle fonti ufficiali.
Guide di configurazione
Iniziare dopo il download
Guide passo passo per ogni strumento di deployment.
Documentazione
Riferimenti tecnici
Documentazione dettagliata per tutti i modelli.
Dopo il download
Cosa fare con i tuoi pesi Gemma 4
Hai scaricato i pesi? Ecco cosa puoi fare dopo.
Inizia
Scarica Gemma 4 e inizia a costruire
Prova online prima, oppure scarica direttamente per un deployment locale e privato. Licenza Apache 2.0 per piena libertà commerciale.