Scarica Gemma 4

Scarica i pesi ufficiali di Gemma 4 - Licenza Apache 2.0

Tutti e quattro i modelli Gemma 4 sono disponibili per il download da Hugging Face, Kaggle e Ollama. Varianti Instruction-Tuned e base, diversi livelli di quantizzazione e piena libertà commerciale con Apache 2.0.

Modelli disponibili

Tutte le varianti Gemma 4 pronte per il download

Ogni modello è disponibile in variante Instruction-Tuned (IT) e base. Scegli in base al tuo caso d'uso: IT per chat e attività, base per il fine-tuning.

Opzioni di download

Diversi formati e livelli di quantizzazione

I modelli sono disponibili in BF16 (precisione piena), GGUF (per llama.cpp/Ollama) e ONNX (per il deployment edge). Le versioni quantizzate da 4 bit a 8 bit riducono i requisiti di memoria.

Per la maggior parte degli utenti, consigliamo Ollama (seleziona automaticamente la quantizzazione giusta) o i file GGUF di Hugging Face per llama.cpp.

Edge - 2,3 mld parametri effettivi

Gemma 4 E2B

Il modello più piccolo. 3,2 GB a 4 bit. Funziona su smartphone, IoT e hardware economico.

Include encoder audio. Ideale per deployment ultracompatti dove la memoria è il vincolo principale.

Download da 2 a 10 GB

Edge - 4,5 mld parametri effettivi

Gemma 4 E4B

Modello edge consigliato. 5,5 GB a 4 bit. Migliore qualità per laptop e desktop.

Include encoder audio. Ragionamento e programmazione potenti sul dispositivo.

Download da 4 a 16 GB

Server - MoE

Gemma 4 26B A4B

Modello MoE efficiente. 16 GB a 4 bit. Qualità vicina al 31B con costo di inferenza di 4B.

128 esperti, 8 attivi + 1 condiviso. Ideale per servizi di produzione ad alto throughput.

Download da 10 a 48 GB

Server - Flagship

Gemma 4 31B

Qualità massima. 17 GB a 4 bit. 3° nella classifica Arena AI.

Architettura Dense per la massima affidabilità. Ideale per applicazioni dove la qualità è critica.

Download da 12 a 58 GB

Fonti di download

Piattaforme di download ufficiali

Scarica da fonti ufficiali affidabili. Tutti i modelli sono verificati e mantenuti da Google DeepMind.

Hugging Face

Repository completi con tutte le varianti, quantizzazioni e documentazione. La fonte più completa per i pesi Gemma 4.

Kaggle

Hosting ufficiale dei modelli Google. Scarica i pesi e accedi ai notebook per sperimentazione e fine-tuning.

Ollama

Download ed esecuzione con un solo comando. Ollama seleziona automaticamente la quantizzazione giusta per il tuo hardware.

Google AI Studio

Nessun download necessario. Usa Gemma 4 tramite API ospitata per prototipazione e sviluppo.

Formato GGUF

Ottimizzato per llama.cpp e Ollama. Diversi livelli di quantizzazione da Q4_K_M a Q8_0 per diversi budget di memoria.

Formato ONNX

Deployment multipiattaforma per dispositivi edge, mobile e browser. Ottimizzato per l'inferenza su hardware diverso.

Download rapido

Il modo più veloce per iniziare

Usa Ollama per il percorso più rapido dal download all'esecuzione. Un solo comando fa tutto.

Comandi Ollama

  • ollama pull gemma4:e2b - Edge ultracompatto
  • ollama pull gemma4:e4b - Edge consigliato
  • ollama pull gemma4:26b - Server MoE
  • ollama pull gemma4:31b - Server flagship
  • ollama run gemma4:e4b - Scarica e inizia a chattare

Hugging Face CLI

  • pip install huggingface_hub
  • huggingface-cli download google/gemma-4-e4b-it
  • huggingface-cli download google/gemma-4-26b-a4b-it
  • huggingface-cli download google/gemma-4-31b-it
  • Aggiungi --revision per quantizzazioni specifiche

Dimensioni di download

Dimensioni dei file per modello e quantizzazione

Scegli la quantizzazione giusta per i tuoi vincoli di archiviazione e memoria. Quantizzazioni più piccole sacrificano un po' di qualità per dimensioni dei file notevolmente ridotte.

Le dimensioni di download variano in base al livello di quantizzazione. La quantizzazione a 4 bit (Q4_K_M) offre il miglior equilibrio tra qualità e dimensione per la maggior parte degli utenti.

Confronto delle dimensioni di download di Gemma 4 tra modelli e quantizzazioni

E2B a 4 bit: circa 2 GB di download, circa 3,2 GB in memoria

E4B a 4 bit: circa 4 GB di download, circa 5,5 GB in memoria

26B a 4 bit: circa 10 GB di download, circa 16 GB in memoria

31B a 4 bit: circa 12 GB di download, circa 17 GB in memoria

Confronto dimensioni

Requisiti di download e memoria

Dimensioni dei file per diversi livelli di quantizzazione di tutti i modelli Gemma 4.

Benchmark
E2B
E2B
E4B
E4B
26B MoE
26B
31B Dense
31B
4-bit GGUF
Consigliato
~2 GB~4 GB~10 GB~12 GB
8-bit GGUF
Qualità superiore
~5 GB~8 GB~24 GB~29 GB
BF16
Precisione piena
~10 GB~16 GB~48 GB~58 GB
VRAM needed
A 4 bit
~3.2 GB~5.5 GB~16 GB~17 GB

Dimensioni approssimative. Il download effettivo può variare leggermente in base alla fonte e al formato.

Apache 2.0

Piena libertà commerciale con licenza Apache 2.0

Ogni modello Gemma 4 è rilasciato con licenza Apache 2.0. Nessun limite MAU, nessuna restrizione d'uso, nessuna royalty. Uso commerciale, modifica libera, distribuzione senza limitazioni.

  • Uso commerciale completo senza restrizioni
  • Modifica e distribuzione libere
  • Nessun limite d'uso o obbligo di reportistica
Piena libertà commerciale con licenza Apache 2.0

Formati multipli

GGUF, ONNX, SafeTensors e altro

Gemma 4 è disponibile in diversi formati per diversi target di deployment. GGUF per llama.cpp/Ollama, ONNX per dispositivi edge, SafeTensors per transformers e altro.

  • GGUF: llama.cpp, Ollama, LM Studio, GPT4All
  • ONNX: dispositivi edge, mobile, deployment browser
  • SafeTensors: Hugging Face transformers, vLLM, TGI
GGUF, ONNX, SafeTensors e altro

Fonti verificate

Scarica solo da fonti ufficiali verificate

Tutti i pesi Gemma 4 sono pubblicati da Google DeepMind sulle piattaforme ufficiali. Verifica sempre l'editore prima di scaricare per ottenere pesi autentici e non modificati.

  • Hugging Face: organizzazione google/ verificata
  • Kaggle: editore google/ verificato
  • Ollama: voce ufficiale della libreria
Scarica solo da fonti ufficiali verificate

Dopo il download

Cosa fare con i tuoi pesi Gemma 4

Hai scaricato i pesi? Ecco cosa puoi fare dopo.

Esecuzione locale

Guida completa al deployment locale

Leggi la guida

Accesso API

Usa tramite API ospitata in alternativa

Inizia

Fine-tuning

Personalizza per le tue attività specifiche

Scopri di più

Tutti i modelli

Confronta tutte le varianti Gemma 4

Confronta

Community

Unisciti agli sviluppatori che costruiscono con Gemma

Esplora

Scheda del modello

Specifiche tecniche

Visualizza

Inizia

Scarica Gemma 4 e inizia a costruire

Prova online prima, oppure scarica direttamente per un deployment locale e privato. Licenza Apache 2.0 per piena libertà commerciale.