Gemma 4 다운로드
Gemma 4 공식 가중치 다운로드 - Apache 2.0 라이선스
Gemma 4의 4가지 모델 모두 Hugging Face, Kaggle, Ollama에서 다운로드할 수 있습니다. Instruction-tuned 및 베이스 변형, 다양한 양자화 수준, Apache 2.0 기반의 완전한 상업적 자유.
이용 가능한 모델
다운로드 가능한 모든 Gemma 4 변형
각 모델은 Instruction-tuned(IT)와 베이스 변형으로 제공됩니다. 용도에 따라 선택하세요: IT는 채팅과 작업용, 베이스는 파인튜닝용.
다운로드 옵션
다양한 포맷과 양자화 수준
모델은 BF16(풀 정밀도), GGUF(llama.cpp/Ollama용), ONNX(엣지 배포용)로 제공됩니다. 4비트에서 8비트까지의 양자화 버전으로 메모리 요구 사항을 줄일 수 있습니다.
대부분의 사용자에게는 Ollama(하드웨어에 맞는 양자화 자동 선택) 또는 Hugging Face GGUF 파일(llama.cpp용)을 추천합니다.
엣지 - 2.3B 유효 파라미터
Gemma 4 E2B
가장 작은 모델. 4비트에서 3.2GB. 스마트폰, IoT, 저예산 하드웨어에서 실행.
오디오 인코더 포함. 메모리가 주요 제약인 초소형 배포에 최적.
엣지 - 4.5B 유효 파라미터
Gemma 4 E4B
추천 엣지 모델. 4비트에서 5.5GB. 노트북과 데스크톱에 최적의 품질.
오디오 인코더 포함. 온디바이스에서 강력한 추론과 코딩.
서버 - MoE
Gemma 4 26B A4B
효율적인 MoE 모델. 4비트에서 16GB. 4B 추론 비용으로 31B에 근접한 품질.
128개 전문가, 8개 활성 + 1개 공유. 고처리량 프로덕션 서빙에 최적.
서버 - 플래그십
Gemma 4 31B
최고 품질. 4비트에서 17GB. Arena AI 리더보드 3위.
최대 신뢰성을 위한 Dense 아키텍처. 품질이 중요한 애플리케이션에 최적.
다운로드 소스
공식 다운로드 플랫폼
신뢰할 수 있는 공식 소스에서 다운로드하세요. 모든 모델은 Google DeepMind에서 검증 및 관리합니다.
Hugging Face
모든 변형, 양자화, 문서를 포함한 완전한 모델 리포지토리. Gemma 4 가중치의 가장 포괄적인 소스.
Kaggle
Google 공식 모델 호스팅. 가중치 다운로드 및 실험과 파인튜닝을 위한 노트북 접근.
Ollama
명령어 하나로 다운로드하고 실행. Ollama가 하드웨어에 맞는 양자화를 자동으로 선택합니다.
Google AI Studio
다운로드 불필요. 호스팅된 API를 통해 프로토타이핑과 개발에 Gemma 4를 활용.
GGUF 포맷
llama.cpp와 Ollama에 최적화. Q4_K_M부터 Q8_0까지 메모리 예산에 맞는 다양한 양자화 수준.
ONNX 포맷
엣지 디바이스, 모바일, 브라우저를 위한 크로스 플랫폼 배포. 다양한 하드웨어에서의 추론에 최적화.
빠른 다운로드
가장 빠르게 시작하는 방법
다운로드에서 실행까지 가장 빠른 경로는 Ollama입니다. 명령어 하나로 모든 것이 완료됩니다.
Ollama 명령어
- ollama pull gemma4:e2b - 엣지 초소형
- ollama pull gemma4:e4b - 엣지 추천
- ollama pull gemma4:26b - 서버 MoE
- ollama pull gemma4:31b - 서버 플래그십
- ollama run gemma4:e4b - 다운로드 후 바로 채팅 시작
Hugging Face CLI
- pip install huggingface_hub
- huggingface-cli download google/gemma-4-e4b-it
- huggingface-cli download google/gemma-4-26b-a4b-it
- huggingface-cli download google/gemma-4-31b-it
- 특정 양자화는 --revision 추가
다운로드 크기
모델 및 양자화별 파일 크기
스토리지와 메모리 제약에 맞는 양자화를 선택하세요. 작은 양자화는 약간의 품질을 희생하여 파일 크기를 크게 줄입니다.
E2B 4비트: 약 2GB 다운로드, 메모리 약 3.2GB
E4B 4비트: 약 4GB 다운로드, 메모리 약 5.5GB
26B 4비트: 약 10GB 다운로드, 메모리 약 16GB
31B 4비트: 약 12GB 다운로드, 메모리 약 17GB
크기 비교
다운로드 및 메모리 요구 사항
모든 Gemma 4 모델의 양자화 수준별 파일 크기.
| Benchmark | E2B E2B | E4B E4B | 26B MoE 26B | 31B Dense 31B |
|---|---|---|---|---|
4-bit GGUF 추천 | ~2 GB | ~4 GB | ~10 GB | ~12 GB |
8-bit GGUF 고품질 | ~5 GB | ~8 GB | ~24 GB | ~29 GB |
BF16 풀 정밀도 | ~10 GB | ~16 GB | ~48 GB | ~58 GB |
VRAM needed 4비트 기준 | ~3.2 GB | ~5.5 GB | ~16 GB | ~17 GB |
대략적인 크기입니다. 실제 다운로드 크기는 소스와 포맷에 따라 약간 다를 수 있습니다.
다양한 포맷
GGUF, ONNX, SafeTensors 등
Gemma 4는 배포 대상에 따라 다양한 포맷으로 제공됩니다. llama.cpp/Ollama용 GGUF, 엣지 디바이스용 ONNX, transformers용 SafeTensors 등.
- GGUF: llama.cpp, Ollama, LM Studio, GPT4All
- ONNX: 엣지 디바이스, 모바일, 브라우저 배포
- SafeTensors: Hugging Face transformers, vLLM, TGI
검증된 소스
공식 검증된 소스에서만 다운로드
모든 Gemma 4 가중치는 Google DeepMind가 공식 플랫폼에서 게시합니다. 정품 미수정 가중치를 확실히 받으려면 다운로드 전 게시자를 항상 확인하세요.
- Hugging Face: google/ 조직 검증됨
- Kaggle: google/ 게시자 검증됨
- Ollama: 공식 라이브러리 항목
공식 소스
검증된 플랫폼에서 다운로드
공식 소스에서 정품 Gemma 4 가중치를 받으세요.
설정 가이드
다운로드 후 실행하기
각 배포 도구의 단계별 가이드.
시작하기
Gemma 4를 다운로드하고 개발을 시작하세요
먼저 온라인으로 체험하거나, 프라이빗 로컬 배포를 위해 직접 다운로드하세요. Apache 2.0 라이선스로 완전한 상업적 자유.

