تحميل Gemma 4
حمّل الأوزان الرسمية لـ Gemma 4 - ترخيص Apache 2.0
جميع نماذج Gemma 4 الأربعة متاحة للتحميل من Hugging Face وKaggle وOllama. إصدارات Instruction-Tuned وأساسية، مستويات تكميم متعددة، وحرية تجارية كاملة بموجب Apache 2.0.
النماذج المتاحة
جميع إصدارات Gemma 4 جاهزة للتحميل
كل نموذج متاح بإصدار Instruction-Tuned (IT) وأساسي. اختر حسب حالة الاستخدام: IT للمحادثة والمهام، الأساسي للتخصيص.
خيارات التحميل
صيغ متعددة ومستويات تكميم مختلفة
النماذج متاحة بصيغة BF16 (دقة كاملة) وGGUF (لـ llama.cpp/Ollama) وONNX (للنشر الطرفي). الإصدارات المكمّمة من 4 بت إلى 8 بت تقلل متطلبات الذاكرة.
لمعظم المستخدمين، ننصح بالبدء مع Ollama (يختار التكميم المناسب تلقائياً) أو ملفات GGUF من Hugging Face لـ llama.cpp.
طرفي - 2.3B معامل فعّال
Gemma 4 E2B
أصغر نموذج. 3.2GB بدقة 4 بت. يعمل على الهواتف وأجهزة IoT والأجهزة الاقتصادية.
يتضمن مُشفِّر صوت. مثالي للنشر فائق الصغر حيث تكون الذاكرة هي القيد الأساسي.
طرفي - 4.5B معامل فعّال
Gemma 4 E4B
النموذج الطرفي الموصى به. 5.5GB بدقة 4 بت. أفضل جودة للحواسيب المحمولة والمكتبية.
يتضمن مُشفِّر صوت. استدلال وبرمجة قوية على الجهاز.
خادم - MoE
Gemma 4 26B A4B
نموذج MoE فعّال. 16GB بدقة 4 بت. جودة قريبة من 31B بتكلفة استدلال 4B.
128 خبيراً، 8 نشطين + 1 مشترك. مثالي لخدمة الإنتاج عالية الإنتاجية.
خادم - الرئيسي
Gemma 4 31B
أعلى جودة. 17GB بدقة 4 بت. المركز الثالث على تصنيف Arena AI.
بنية Dense لأقصى موثوقية. مثالي للتطبيقات التي تتطلب جودة عالية.
مصادر التحميل
منصات التحميل الرسمية
حمّل من مصادر رسمية موثوقة. جميع النماذج مُتحقق منها ومُدارة من Google DeepMind.
Hugging Face
مستودعات نماذج كاملة مع جميع الإصدارات والتكميمات والتوثيق. المصدر الأشمل لأوزان Gemma 4.
Kaggle
استضافة نماذج Google الرسمية. حمّل الأوزان واستخدم الدفاتر للتجريب والتخصيص.
Ollama
تحميل وتشغيل بأمر واحد. يختار Ollama التكميم المناسب لأجهزتك تلقائياً.
Google AI Studio
لا حاجة للتحميل. استخدم Gemma 4 عبر API مُستضافة للنمذجة الأولية والتطوير.
صيغة GGUF
مُحسَّنة لـ llama.cpp وOllama. مستويات تكميم متعددة من Q4_K_M إلى Q8_0 لميزانيات ذاكرة مختلفة.
صيغة ONNX
نشر متعدد المنصات للأجهزة الطرفية والمحمولة والمتصفحات. مُحسَّنة للاستدلال على أجهزة متنوعة.
تحميل سريع
أسرع طريقة للبدء
استخدم Ollama لأسرع مسار من التحميل إلى التشغيل. أمر واحد يفعل كل شيء.
أوامر Ollama
- ollama pull gemma4:e2b - طرفي فائق الصغر
- ollama pull gemma4:e4b - طرفي موصى به
- ollama pull gemma4:26b - خادم MoE
- ollama pull gemma4:31b - خادم رئيسي
- ollama run gemma4:e4b - تحميل وبدء المحادثة فوراً
Hugging Face CLI
- pip install huggingface_hub
- huggingface-cli download google/gemma-4-e4b-it
- huggingface-cli download google/gemma-4-26b-a4b-it
- huggingface-cli download google/gemma-4-31b-it
- أضف --revision لتكميمات محددة
أحجام التحميل
أحجام الملفات حسب النموذج والتكميم
اختر التكميم المناسب لقيود التخزين والذاكرة لديك. التكميمات الأصغر تستبدل بعض الجودة بأحجام ملفات أصغر بكثير.
تختلف أحجام التحميل حسب مستوى التكميم. تكميم 4 بت (Q4_K_M) يوفر أفضل توازن بين الجودة والحجم لمعظم المستخدمين.


E2B بدقة 4 بت: حوالي 2GB تحميل، حوالي 3.2GB في الذاكرة
E4B بدقة 4 بت: حوالي 4GB تحميل، حوالي 5.5GB في الذاكرة
26B بدقة 4 بت: حوالي 10GB تحميل، حوالي 16GB في الذاكرة
31B بدقة 4 بت: حوالي 12GB تحميل، حوالي 17GB في الذاكرة
مقارنة الأحجام
متطلبات التحميل والذاكرة
أحجام الملفات لمستويات التكميم المختلفة عبر جميع نماذج Gemma 4.
| Benchmark | E2B E2B | E4B E4B | 26B MoE 26B | 31B Dense 31B |
|---|---|---|---|---|
4-bit GGUF موصى به | ~2 GB | ~4 GB | ~10 GB | ~12 GB |
8-bit GGUF جودة أعلى | ~5 GB | ~8 GB | ~24 GB | ~29 GB |
BF16 دقة كاملة | ~10 GB | ~16 GB | ~48 GB | ~58 GB |
VRAM needed بدقة 4 بت | ~3.2 GB | ~5.5 GB | ~16 GB | ~17 GB |
أحجام تقريبية. قد يختلف التحميل الفعلي قليلاً حسب المصدر والصيغة.
Apache 2.0
حرية تجارية كاملة مع ترخيص Apache 2.0
جميع نماذج Gemma 4 مُصدرة بموجب ترخيص Apache 2.0. بدون حدود MAU، بدون قيود استخدام، بدون رسوم ترخيص. استخدام تجاري، تعديل حر، توزيع بدون قيود.
- استخدام تجاري كامل بدون قيود
- تعديل وتوزيع حر
- بدون حدود استخدام أو التزامات إبلاغ
صيغ متعددة
GGUF وONNX وSafeTensors والمزيد
Gemma 4 متاح بصيغ متعددة لأهداف نشر مختلفة. GGUF لـ llama.cpp/Ollama، ONNX للأجهزة الطرفية، SafeTensors لـ transformers والمزيد.
- GGUF: llama.cpp، Ollama، LM Studio، GPT4All
- ONNX: أجهزة طرفية، محمول، نشر في المتصفح
- SafeTensors: Hugging Face transformers، vLLM، TGI
مصادر مُتحقق منها
حمّل فقط من مصادر رسمية مُتحقق منها
جميع أوزان Gemma 4 منشورة من Google DeepMind على المنصات الرسمية. تحقق دائماً من الناشر قبل التحميل لضمان الحصول على أوزان أصلية غير معدّلة.
- Hugging Face: منظمة google/ مُتحقق منها
- Kaggle: ناشر google/ مُتحقق منه
- Ollama: إدخال رسمي في المكتبة
المصادر الرسمية
حمّل من منصات مُتحقق منها
احصل على أوزان Gemma 4 الأصلية من المصادر الرسمية.
أدلة الإعداد
البدء بعد التحميل
أدلة خطوة بخطوة لكل أداة نشر.
التوثيق
المراجع التقنية
توثيق مفصّل لجميع النماذج.
بعد التحميل
ماذا تفعل بأوزان Gemma 4 الخاصة بك
حمّلت الأوزان؟ إليك ما يمكنك فعله بعد ذلك.
ابدأ الآن
حمّل Gemma 4 وابدأ البناء
جرّبه عبر الإنترنت أولاً، أو حمّل مباشرة للنشر المحلي والخاص. ترخيص Apache 2.0 لحرية تجارية كاملة.