تحميل Gemma 4

حمّل الأوزان الرسمية لـ Gemma 4 - ترخيص Apache 2.0

جميع نماذج Gemma 4 الأربعة متاحة للتحميل من Hugging Face وKaggle وOllama. إصدارات Instruction-Tuned وأساسية، مستويات تكميم متعددة، وحرية تجارية كاملة بموجب Apache 2.0.

جرّب قبل التحميل عرض جميع الإصدارات

النماذج المتاحة

جميع إصدارات Gemma 4 جاهزة للتحميل

كل نموذج متاح بإصدار Instruction-Tuned (IT) وأساسي. اختر حسب حالة الاستخدام: IT للمحادثة والمهام، الأساسي للتخصيص.

خيارات التحميل

صيغ متعددة ومستويات تكميم مختلفة

النماذج متاحة بصيغة BF16 (دقة كاملة) وGGUF (لـ llama.cpp/Ollama) وONNX (للنشر الطرفي). الإصدارات المكمّمة من 4 بت إلى 8 بت تقلل متطلبات الذاكرة.

لمعظم المستخدمين، ننصح بالبدء مع Ollama (يختار التكميم المناسب تلقائياً) أو ملفات GGUF من Hugging Face لـ llama.cpp.

جرّب قبل التحميل دليل الأجهزة

طرفي - 2.3B معامل فعّال

Gemma 4 E2B

أصغر نموذج. 3.2GB بدقة 4 بت. يعمل على الهواتف وأجهزة IoT والأجهزة الاقتصادية.

يتضمن مُشفِّر صوت. مثالي للنشر فائق الصغر حيث تكون الذاكرة هي القيد الأساسي.

تحميل من 2 إلى 10 GB

Hugging Face Ollama

طرفي - 4.5B معامل فعّال

Gemma 4 E4B

النموذج الطرفي الموصى به. 5.5GB بدقة 4 بت. أفضل جودة للحواسيب المحمولة والمكتبية.

يتضمن مُشفِّر صوت. استدلال وبرمجة قوية على الجهاز.

تحميل من 4 إلى 16 GB

Hugging Face Ollama

خادم - MoE

Gemma 4 26B A4B

نموذج MoE فعّال. 16GB بدقة 4 بت. جودة قريبة من 31B بتكلفة استدلال 4B.

128 خبيراً، 8 نشطين + 1 مشترك. مثالي لخدمة الإنتاج عالية الإنتاجية.

تحميل من 10 إلى 48 GB

Hugging Face Ollama

خادم - الرئيسي

Gemma 4 31B

أعلى جودة. 17GB بدقة 4 بت. المركز الثالث على تصنيف Arena AI.

بنية Dense لأقصى موثوقية. مثالي للتطبيقات التي تتطلب جودة عالية.

تحميل من 12 إلى 58 GB

Hugging Face Ollama

مصادر التحميل

منصات التحميل الرسمية

حمّل من مصادر رسمية موثوقة. جميع النماذج مُتحقق منها ومُدارة من Google DeepMind.

Hugging Face

مستودعات نماذج كاملة مع جميع الإصدارات والتكميمات والتوثيق. المصدر الأشمل لأوزان Gemma 4.

Kaggle

استضافة نماذج Google الرسمية. حمّل الأوزان واستخدم الدفاتر للتجريب والتخصيص.

Ollama

تحميل وتشغيل بأمر واحد. يختار Ollama التكميم المناسب لأجهزتك تلقائياً.

Google AI Studio

لا حاجة للتحميل. استخدم Gemma 4 عبر API مُستضافة للنمذجة الأولية والتطوير.

صيغة GGUF

مُحسَّنة لـ llama.cpp وOllama. مستويات تكميم متعددة من Q4_K_M إلى Q8_0 لميزانيات ذاكرة مختلفة.

صيغة ONNX

نشر متعدد المنصات للأجهزة الطرفية والمحمولة والمتصفحات. مُحسَّنة للاستدلال على أجهزة متنوعة.

تحميل سريع

أسرع طريقة للبدء

استخدم Ollama لأسرع مسار من التحميل إلى التشغيل. أمر واحد يفعل كل شيء.

أوامر Ollama

ollama pull gemma4:e2b - طرفي فائق الصغر
ollama pull gemma4:e4b - طرفي موصى به
ollama pull gemma4:26b - خادم MoE
ollama pull gemma4:31b - خادم رئيسي
ollama run gemma4:e4b - تحميل وبدء المحادثة فوراً

Hugging Face CLI

pip install huggingface_hub
huggingface-cli download google/gemma-4-e4b-it
huggingface-cli download google/gemma-4-26b-a4b-it
huggingface-cli download google/gemma-4-31b-it
أضف --revision لتكميمات محددة

جرّب قبل التحميل عرض جميع النماذج

أحجام التحميل

أحجام الملفات حسب النموذج والتكميم

اختر التكميم المناسب لقيود التخزين والذاكرة لديك. التكميمات الأصغر تستبدل بعض الجودة بأحجام ملفات أصغر بكثير.

تختلف أحجام التحميل حسب مستوى التكميم. تكميم 4 بت (Q4_K_M) يوفر أفضل توازن بين الجودة والحجم لمعظم المستخدمين.

حمّل الآن دليل الأجهزة

مخطط مقارنة أحجام تحميل Gemma 4 عبر النماذج والتكميمات

E2B بدقة 4 بت: حوالي 2GB تحميل، حوالي 3.2GB في الذاكرة

E4B بدقة 4 بت: حوالي 4GB تحميل، حوالي 5.5GB في الذاكرة

26B بدقة 4 بت: حوالي 10GB تحميل، حوالي 16GB في الذاكرة

31B بدقة 4 بت: حوالي 12GB تحميل، حوالي 17GB في الذاكرة

مقارنة الأحجام

متطلبات التحميل والذاكرة

أحجام الملفات لمستويات التكميم المختلفة عبر جميع نماذج Gemma 4.

Benchmark	E2B E2B	E4B E4B	26B MoE 26B	31B Dense 31B
4-bit GGUF موصى به	~2 GB	~4 GB	~10 GB	~12 GB
8-bit GGUF جودة أعلى	~5 GB	~8 GB	~24 GB	~29 GB
BF16 دقة كاملة	~10 GB	~16 GB	~48 GB	~58 GB
VRAM needed بدقة 4 بت	~3.2 GB	~5.5 GB	~16 GB	~17 GB