تحميل Gemma 4

حمّل الأوزان الرسمية لـ Gemma 4 - ترخيص Apache 2.0

جميع نماذج Gemma 4 الأربعة متاحة للتحميل من Hugging Face وKaggle وOllama. إصدارات Instruction-Tuned وأساسية، مستويات تكميم متعددة، وحرية تجارية كاملة بموجب Apache 2.0.

النماذج المتاحة

جميع إصدارات Gemma 4 جاهزة للتحميل

كل نموذج متاح بإصدار Instruction-Tuned (IT) وأساسي. اختر حسب حالة الاستخدام: IT للمحادثة والمهام، الأساسي للتخصيص.

خيارات التحميل

صيغ متعددة ومستويات تكميم مختلفة

النماذج متاحة بصيغة BF16 (دقة كاملة) وGGUF (لـ llama.cpp/Ollama) وONNX (للنشر الطرفي). الإصدارات المكمّمة من 4 بت إلى 8 بت تقلل متطلبات الذاكرة.

لمعظم المستخدمين، ننصح بالبدء مع Ollama (يختار التكميم المناسب تلقائياً) أو ملفات GGUF من Hugging Face لـ llama.cpp.

طرفي - 2.3B معامل فعّال

Gemma 4 E2B

أصغر نموذج. 3.2GB بدقة 4 بت. يعمل على الهواتف وأجهزة IoT والأجهزة الاقتصادية.

يتضمن مُشفِّر صوت. مثالي للنشر فائق الصغر حيث تكون الذاكرة هي القيد الأساسي.

تحميل من 2 إلى 10 GB

طرفي - 4.5B معامل فعّال

Gemma 4 E4B

النموذج الطرفي الموصى به. 5.5GB بدقة 4 بت. أفضل جودة للحواسيب المحمولة والمكتبية.

يتضمن مُشفِّر صوت. استدلال وبرمجة قوية على الجهاز.

تحميل من 4 إلى 16 GB

خادم - MoE

Gemma 4 26B A4B

نموذج MoE فعّال. 16GB بدقة 4 بت. جودة قريبة من 31B بتكلفة استدلال 4B.

128 خبيراً، 8 نشطين + 1 مشترك. مثالي لخدمة الإنتاج عالية الإنتاجية.

تحميل من 10 إلى 48 GB

خادم - الرئيسي

Gemma 4 31B

أعلى جودة. 17GB بدقة 4 بت. المركز الثالث على تصنيف Arena AI.

بنية Dense لأقصى موثوقية. مثالي للتطبيقات التي تتطلب جودة عالية.

تحميل من 12 إلى 58 GB

مصادر التحميل

منصات التحميل الرسمية

حمّل من مصادر رسمية موثوقة. جميع النماذج مُتحقق منها ومُدارة من Google DeepMind.

Hugging Face

مستودعات نماذج كاملة مع جميع الإصدارات والتكميمات والتوثيق. المصدر الأشمل لأوزان Gemma 4.

Kaggle

استضافة نماذج Google الرسمية. حمّل الأوزان واستخدم الدفاتر للتجريب والتخصيص.

Ollama

تحميل وتشغيل بأمر واحد. يختار Ollama التكميم المناسب لأجهزتك تلقائياً.

Google AI Studio

لا حاجة للتحميل. استخدم Gemma 4 عبر API مُستضافة للنمذجة الأولية والتطوير.

صيغة GGUF

مُحسَّنة لـ llama.cpp وOllama. مستويات تكميم متعددة من Q4_K_M إلى Q8_0 لميزانيات ذاكرة مختلفة.

صيغة ONNX

نشر متعدد المنصات للأجهزة الطرفية والمحمولة والمتصفحات. مُحسَّنة للاستدلال على أجهزة متنوعة.

تحميل سريع

أسرع طريقة للبدء

استخدم Ollama لأسرع مسار من التحميل إلى التشغيل. أمر واحد يفعل كل شيء.

أوامر Ollama

  • ollama pull gemma4:e2b - طرفي فائق الصغر
  • ollama pull gemma4:e4b - طرفي موصى به
  • ollama pull gemma4:26b - خادم MoE
  • ollama pull gemma4:31b - خادم رئيسي
  • ollama run gemma4:e4b - تحميل وبدء المحادثة فوراً

Hugging Face CLI

  • pip install huggingface_hub
  • huggingface-cli download google/gemma-4-e4b-it
  • huggingface-cli download google/gemma-4-26b-a4b-it
  • huggingface-cli download google/gemma-4-31b-it
  • أضف --revision لتكميمات محددة

أحجام التحميل

أحجام الملفات حسب النموذج والتكميم

اختر التكميم المناسب لقيود التخزين والذاكرة لديك. التكميمات الأصغر تستبدل بعض الجودة بأحجام ملفات أصغر بكثير.

تختلف أحجام التحميل حسب مستوى التكميم. تكميم 4 بت (Q4_K_M) يوفر أفضل توازن بين الجودة والحجم لمعظم المستخدمين.

مخطط مقارنة أحجام تحميل Gemma 4 عبر النماذج والتكميمات

E2B بدقة 4 بت: حوالي 2GB تحميل، حوالي 3.2GB في الذاكرة

E4B بدقة 4 بت: حوالي 4GB تحميل، حوالي 5.5GB في الذاكرة

26B بدقة 4 بت: حوالي 10GB تحميل، حوالي 16GB في الذاكرة

31B بدقة 4 بت: حوالي 12GB تحميل، حوالي 17GB في الذاكرة

مقارنة الأحجام

متطلبات التحميل والذاكرة

أحجام الملفات لمستويات التكميم المختلفة عبر جميع نماذج Gemma 4.

Benchmark
E2B
E2B
E4B
E4B
26B MoE
26B
31B Dense
31B
4-bit GGUF
موصى به
~2 GB~4 GB~10 GB~12 GB
8-bit GGUF
جودة أعلى
~5 GB~8 GB~24 GB~29 GB
BF16
دقة كاملة
~10 GB~16 GB~48 GB~58 GB
VRAM needed
بدقة 4 بت
~3.2 GB~5.5 GB~16 GB~17 GB

أحجام تقريبية. قد يختلف التحميل الفعلي قليلاً حسب المصدر والصيغة.

Apache 2.0

حرية تجارية كاملة مع ترخيص Apache 2.0

جميع نماذج Gemma 4 مُصدرة بموجب ترخيص Apache 2.0. بدون حدود MAU، بدون قيود استخدام، بدون رسوم ترخيص. استخدام تجاري، تعديل حر، توزيع بدون قيود.

  • استخدام تجاري كامل بدون قيود
  • تعديل وتوزيع حر
  • بدون حدود استخدام أو التزامات إبلاغ
حرية تجارية كاملة مع ترخيص Apache 2.0

صيغ متعددة

GGUF وONNX وSafeTensors والمزيد

Gemma 4 متاح بصيغ متعددة لأهداف نشر مختلفة. GGUF لـ llama.cpp/Ollama، ONNX للأجهزة الطرفية، SafeTensors لـ transformers والمزيد.

  • GGUF: llama.cpp، Ollama، LM Studio، GPT4All
  • ONNX: أجهزة طرفية، محمول، نشر في المتصفح
  • SafeTensors: Hugging Face transformers، vLLM، TGI
GGUF وONNX وSafeTensors والمزيد

مصادر مُتحقق منها

حمّل فقط من مصادر رسمية مُتحقق منها

جميع أوزان Gemma 4 منشورة من Google DeepMind على المنصات الرسمية. تحقق دائماً من الناشر قبل التحميل لضمان الحصول على أوزان أصلية غير معدّلة.

  • Hugging Face: منظمة google/ مُتحقق منها
  • Kaggle: ناشر google/ مُتحقق منه
  • Ollama: إدخال رسمي في المكتبة
حمّل فقط من مصادر رسمية مُتحقق منها

بعد التحميل

ماذا تفعل بأوزان Gemma 4 الخاصة بك

حمّلت الأوزان؟ إليك ما يمكنك فعله بعد ذلك.

التشغيل المحلي

دليل شامل للنشر المحلي

اقرأ الدليل

الوصول عبر API

استخدم عبر API مُستضافة بدلاً من ذلك

ابدأ

التخصيص

خصّص لمهامك المحددة

اعرف المزيد

جميع النماذج

قارن جميع إصدارات Gemma 4

قارن

المجتمع

انضم إلى المطورين الذين يبنون مع Gemma

استكشف

بطاقة النموذج

المواصفات التقنية

عرض

ابدأ الآن

حمّل Gemma 4 وابدأ البناء

جرّبه عبر الإنترنت أولاً، أو حمّل مباشرة للنشر المحلي والخاص. ترخيص Apache 2.0 لحرية تجارية كاملة.