Gemma 4 다운로드

Gemma 4 공식 가중치 다운로드 - Apache 2.0 라이선스

Gemma 4의 4가지 모델 모두 Hugging Face, Kaggle, Ollama에서 다운로드할 수 있습니다. Instruction-tuned 및 베이스 변형, 다양한 양자화 수준, Apache 2.0 기반의 완전한 상업적 자유.

이용 가능한 모델

다운로드 가능한 모든 Gemma 4 변형

각 모델은 Instruction-tuned(IT)와 베이스 변형으로 제공됩니다. 용도에 따라 선택하세요: IT는 채팅과 작업용, 베이스는 파인튜닝용.

다운로드 옵션

다양한 포맷과 양자화 수준

모델은 BF16(풀 정밀도), GGUF(llama.cpp/Ollama용), ONNX(엣지 배포용)로 제공됩니다. 4비트에서 8비트까지의 양자화 버전으로 메모리 요구 사항을 줄일 수 있습니다.

대부분의 사용자에게는 Ollama(하드웨어에 맞는 양자화 자동 선택) 또는 Hugging Face GGUF 파일(llama.cpp용)을 추천합니다.

엣지 - 2.3B 유효 파라미터

Gemma 4 E2B

가장 작은 모델. 4비트에서 3.2GB. 스마트폰, IoT, 저예산 하드웨어에서 실행.

오디오 인코더 포함. 메모리가 주요 제약인 초소형 배포에 최적.

약 2-10 GB 다운로드

엣지 - 4.5B 유효 파라미터

Gemma 4 E4B

추천 엣지 모델. 4비트에서 5.5GB. 노트북과 데스크톱에 최적의 품질.

오디오 인코더 포함. 온디바이스에서 강력한 추론과 코딩.

약 4-16 GB 다운로드

서버 - MoE

Gemma 4 26B A4B

효율적인 MoE 모델. 4비트에서 16GB. 4B 추론 비용으로 31B에 근접한 품질.

128개 전문가, 8개 활성 + 1개 공유. 고처리량 프로덕션 서빙에 최적.

약 10-48 GB 다운로드

서버 - 플래그십

Gemma 4 31B

최고 품질. 4비트에서 17GB. Arena AI 리더보드 3위.

최대 신뢰성을 위한 Dense 아키텍처. 품질이 중요한 애플리케이션에 최적.

약 12-58 GB 다운로드

다운로드 소스

공식 다운로드 플랫폼

신뢰할 수 있는 공식 소스에서 다운로드하세요. 모든 모델은 Google DeepMind에서 검증 및 관리합니다.

Hugging Face

모든 변형, 양자화, 문서를 포함한 완전한 모델 리포지토리. Gemma 4 가중치의 가장 포괄적인 소스.

Kaggle

Google 공식 모델 호스팅. 가중치 다운로드 및 실험과 파인튜닝을 위한 노트북 접근.

Ollama

명령어 하나로 다운로드하고 실행. Ollama가 하드웨어에 맞는 양자화를 자동으로 선택합니다.

Google AI Studio

다운로드 불필요. 호스팅된 API를 통해 프로토타이핑과 개발에 Gemma 4를 활용.

GGUF 포맷

llama.cpp와 Ollama에 최적화. Q4_K_M부터 Q8_0까지 메모리 예산에 맞는 다양한 양자화 수준.

ONNX 포맷

엣지 디바이스, 모바일, 브라우저를 위한 크로스 플랫폼 배포. 다양한 하드웨어에서의 추론에 최적화.

빠른 다운로드

가장 빠르게 시작하는 방법

다운로드에서 실행까지 가장 빠른 경로는 Ollama입니다. 명령어 하나로 모든 것이 완료됩니다.

Ollama 명령어

  • ollama pull gemma4:e2b - 엣지 초소형
  • ollama pull gemma4:e4b - 엣지 추천
  • ollama pull gemma4:26b - 서버 MoE
  • ollama pull gemma4:31b - 서버 플래그십
  • ollama run gemma4:e4b - 다운로드 후 바로 채팅 시작

Hugging Face CLI

  • pip install huggingface_hub
  • huggingface-cli download google/gemma-4-e4b-it
  • huggingface-cli download google/gemma-4-26b-a4b-it
  • huggingface-cli download google/gemma-4-31b-it
  • 특정 양자화는 --revision 추가

다운로드 크기

모델 및 양자화별 파일 크기

스토리지와 메모리 제약에 맞는 양자화를 선택하세요. 작은 양자화는 약간의 품질을 희생하여 파일 크기를 크게 줄입니다.

다운로드 크기는 양자화 수준에 따라 다릅니다. 4비트 양자화(Q4_K_M)는 대부분의 사용자에게 품질과 크기의 최적 균형을 제공합니다.

Gemma 4 모델 및 양자화별 다운로드 크기 비교 차트

E2B 4비트: 약 2GB 다운로드, 메모리 약 3.2GB

E4B 4비트: 약 4GB 다운로드, 메모리 약 5.5GB

26B 4비트: 약 10GB 다운로드, 메모리 약 16GB

31B 4비트: 약 12GB 다운로드, 메모리 약 17GB

크기 비교

다운로드 및 메모리 요구 사항

모든 Gemma 4 모델의 양자화 수준별 파일 크기.

Benchmark
E2B
E2B
E4B
E4B
26B MoE
26B
31B Dense
31B
4-bit GGUF
추천
~2 GB~4 GB~10 GB~12 GB
8-bit GGUF
고품질
~5 GB~8 GB~24 GB~29 GB
BF16
풀 정밀도
~10 GB~16 GB~48 GB~58 GB
VRAM needed
4비트 기준
~3.2 GB~5.5 GB~16 GB~17 GB

대략적인 크기입니다. 실제 다운로드 크기는 소스와 포맷에 따라 약간 다를 수 있습니다.

Apache 2.0

Apache 2.0 라이선스로 완전한 상업적 자유

모든 Gemma 4 모델은 Apache 2.0 라이선스로 공개됩니다. MAU 제한 없음, 사용 제한 없음, 로열티 없음. 상업적 사용, 자유로운 수정, 제한 없는 배포가 가능합니다.

  • 제한 없는 완전한 상업적 사용 가능
  • 자유롭게 수정 및 배포 가능
  • 사용 제한이나 보고 의무 없음
Apache 2.0 라이선스로 완전한 상업적 자유

다양한 포맷

GGUF, ONNX, SafeTensors 등

Gemma 4는 배포 대상에 따라 다양한 포맷으로 제공됩니다. llama.cpp/Ollama용 GGUF, 엣지 디바이스용 ONNX, transformers용 SafeTensors 등.

  • GGUF: llama.cpp, Ollama, LM Studio, GPT4All
  • ONNX: 엣지 디바이스, 모바일, 브라우저 배포
  • SafeTensors: Hugging Face transformers, vLLM, TGI
GGUF, ONNX, SafeTensors 등

검증된 소스

공식 검증된 소스에서만 다운로드

모든 Gemma 4 가중치는 Google DeepMind가 공식 플랫폼에서 게시합니다. 정품 미수정 가중치를 확실히 받으려면 다운로드 전 게시자를 항상 확인하세요.

  • Hugging Face: google/ 조직 검증됨
  • Kaggle: google/ 게시자 검증됨
  • Ollama: 공식 라이브러리 항목
공식 검증된 소스에서만 다운로드

다운로드 후

Gemma 4 가중치 활용 방법

가중치를 다운로드하셨나요? 다음에 할 수 있는 것들입니다.

로컬 실행

로컬 배포 완전 가이드

가이드 읽기

API 접근

호스팅된 API로 대신 사용

시작하기

파인튜닝

특정 작업에 맞게 커스터마이즈

자세히 보기

전체 모델

모든 Gemma 4 변형 비교

비교하기

커뮤니티

Gemma로 개발하는 개발자들과 함께

탐색하기

모델 카드

기술 사양

보기

시작하기

Gemma 4를 다운로드하고 개발을 시작하세요

먼저 온라인으로 체험하거나, 프라이빗 로컬 배포를 위해 직접 다운로드하세요. Apache 2.0 라이선스로 완전한 상업적 자유.