Gemma 4 다운로드

Gemma 4 공식 가중치 다운로드 - Apache 2.0 라이선스

Gemma 4의 4가지 모델 모두 Hugging Face, Kaggle, Ollama에서 다운로드할 수 있습니다. Instruction-tuned 및 베이스 변형, 다양한 양자화 수준, Apache 2.0 기반의 완전한 상업적 자유.

다운로드 전 체험하기 전체 변형 보기

이용 가능한 모델

다운로드 가능한 모든 Gemma 4 변형

각 모델은 Instruction-tuned(IT)와 베이스 변형으로 제공됩니다. 용도에 따라 선택하세요: IT는 채팅과 작업용, 베이스는 파인튜닝용.

다운로드 옵션

다양한 포맷과 양자화 수준

모델은 BF16(풀 정밀도), GGUF(llama.cpp/Ollama용), ONNX(엣지 배포용)로 제공됩니다. 4비트에서 8비트까지의 양자화 버전으로 메모리 요구 사항을 줄일 수 있습니다.

대부분의 사용자에게는 Ollama(하드웨어에 맞는 양자화 자동 선택) 또는 Hugging Face GGUF 파일(llama.cpp용)을 추천합니다.

다운로드 전 체험하기 하드웨어 가이드

엣지 - 2.3B 유효 파라미터

Gemma 4 E2B

가장 작은 모델. 4비트에서 3.2GB. 스마트폰, IoT, 저예산 하드웨어에서 실행.

오디오 인코더 포함. 메모리가 주요 제약인 초소형 배포에 최적.

약 2-10 GB 다운로드

Hugging Face Ollama

엣지 - 4.5B 유효 파라미터

Gemma 4 E4B

추천 엣지 모델. 4비트에서 5.5GB. 노트북과 데스크톱에 최적의 품질.

오디오 인코더 포함. 온디바이스에서 강력한 추론과 코딩.

약 4-16 GB 다운로드

Hugging Face Ollama

서버 - MoE

Gemma 4 26B A4B

효율적인 MoE 모델. 4비트에서 16GB. 4B 추론 비용으로 31B에 근접한 품질.

128개 전문가, 8개 활성 + 1개 공유. 고처리량 프로덕션 서빙에 최적.

약 10-48 GB 다운로드

Hugging Face Ollama

서버 - 플래그십

Gemma 4 31B

최고 품질. 4비트에서 17GB. Arena AI 리더보드 3위.

최대 신뢰성을 위한 Dense 아키텍처. 품질이 중요한 애플리케이션에 최적.

약 12-58 GB 다운로드

Hugging Face Ollama

다운로드 소스

공식 다운로드 플랫폼

신뢰할 수 있는 공식 소스에서 다운로드하세요. 모든 모델은 Google DeepMind에서 검증 및 관리합니다.

Hugging Face

모든 변형, 양자화, 문서를 포함한 완전한 모델 리포지토리. Gemma 4 가중치의 가장 포괄적인 소스.

Kaggle

Google 공식 모델 호스팅. 가중치 다운로드 및 실험과 파인튜닝을 위한 노트북 접근.

Ollama

명령어 하나로 다운로드하고 실행. Ollama가 하드웨어에 맞는 양자화를 자동으로 선택합니다.

Google AI Studio

다운로드 불필요. 호스팅된 API를 통해 프로토타이핑과 개발에 Gemma 4를 활용.

GGUF 포맷

llama.cpp와 Ollama에 최적화. Q4_K_M부터 Q8_0까지 메모리 예산에 맞는 다양한 양자화 수준.

ONNX 포맷

엣지 디바이스, 모바일, 브라우저를 위한 크로스 플랫폼 배포. 다양한 하드웨어에서의 추론에 최적화.

빠른 다운로드

가장 빠르게 시작하는 방법

다운로드에서 실행까지 가장 빠른 경로는 Ollama입니다. 명령어 하나로 모든 것이 완료됩니다.

Ollama 명령어

ollama pull gemma4:e2b - 엣지 초소형
ollama pull gemma4:e4b - 엣지 추천
ollama pull gemma4:26b - 서버 MoE
ollama pull gemma4:31b - 서버 플래그십
ollama run gemma4:e4b - 다운로드 후 바로 채팅 시작

Hugging Face CLI

pip install huggingface_hub
huggingface-cli download google/gemma-4-e4b-it
huggingface-cli download google/gemma-4-26b-a4b-it
huggingface-cli download google/gemma-4-31b-it
특정 양자화는 --revision 추가

다운로드 전 체험하기 전체 모델 보기

다운로드 크기

모델 및 양자화별 파일 크기

스토리지와 메모리 제약에 맞는 양자화를 선택하세요. 작은 양자화는 약간의 품질을 희생하여 파일 크기를 크게 줄입니다.

다운로드 크기는 양자화 수준에 따라 다릅니다. 4비트 양자화(Q4_K_M)는 대부분의 사용자에게 품질과 크기의 최적 균형을 제공합니다.

지금 다운로드 하드웨어 가이드

E2B 4비트: 약 2GB 다운로드, 메모리 약 3.2GB

E4B 4비트: 약 4GB 다운로드, 메모리 약 5.5GB

26B 4비트: 약 10GB 다운로드, 메모리 약 16GB

31B 4비트: 약 12GB 다운로드, 메모리 약 17GB

크기 비교

다운로드 및 메모리 요구 사항

모든 Gemma 4 모델의 양자화 수준별 파일 크기.

Benchmark	E2B E2B	E4B E4B	26B MoE 26B	31B Dense 31B
4-bit GGUF 추천	~2 GB	~4 GB	~10 GB	~12 GB
8-bit GGUF 고품질	~5 GB	~8 GB	~24 GB	~29 GB
BF16 풀 정밀도	~10 GB	~16 GB	~48 GB	~58 GB
VRAM needed 4비트 기준	~3.2 GB	~5.5 GB	~16 GB	~17 GB

대략적인 크기입니다. 실제 다운로드 크기는 소스와 포맷에 따라 약간 다를 수 있습니다.

Apache 2.0

Apache 2.0 라이선스로 완전한 상업적 자유

모든 Gemma 4 모델은 Apache 2.0 라이선스로 공개됩니다. MAU 제한 없음, 사용 제한 없음, 로열티 없음. 상업적 사용, 자유로운 수정, 제한 없는 배포가 가능합니다.

제한 없는 완전한 상업적 사용 가능
자유롭게 수정 및 배포 가능
사용 제한이나 보고 의무 없음

지금 다운로드 라이선스 보기

다양한 포맷

GGUF, ONNX, SafeTensors 등

Gemma 4는 배포 대상에 따라 다양한 포맷으로 제공됩니다. llama.cpp/Ollama용 GGUF, 엣지 디바이스용 ONNX, transformers용 SafeTensors 등.

GGUF: llama.cpp, Ollama, LM Studio, GPT4All
ONNX: 엣지 디바이스, 모바일, 브라우저 배포
SafeTensors: Hugging Face transformers, vLLM, TGI

Hugging Face 포맷 가이드

검증된 소스

공식 검증된 소스에서만 다운로드

모든 Gemma 4 가중치는 Google DeepMind가 공식 플랫폼에서 게시합니다. 정품 미수정 가중치를 확실히 받으려면 다운로드 전 게시자를 항상 확인하세요.

Hugging Face: google/ 조직 검증됨
Kaggle: google/ 게시자 검증됨
Ollama: 공식 라이브러리 항목

Hugging Face Kaggle

공식 소스

검증된 플랫폼에서 다운로드

공식 소스에서 정품 Gemma 4 가중치를 받으세요.

모든 모델, 모든 포맷, 모든 양자화

Google 공식 모델 호스팅

명령어 하나로 다운로드 및 실행

다운로드 불필요 - API로 사용

설정 가이드

다운로드 후 실행하기

각 배포 도구의 단계별 가이드.

Ollama 설정

로컬 Gemma 4로의 가장 쉬운 경로

llama.cpp 설정

파워 유저를 위한 최대 제어

MLX 설정

Apple Silicon에 최적화

문서

기술 레퍼런스

모든 모델의 상세 문서.

모델 카드

완전한 기술 사양

API 문서

Gemini API 및 Vertex AI 가이드

파인튜닝 가이드

사용 사례에 맞게 커스터마이즈

하드웨어 가이드

하드웨어에 맞는 모델 선택

다운로드 후

Gemma 4 가중치 활용 방법

가중치를 다운로드하셨나요? 다음에 할 수 있는 것들입니다.

로컬에서 실행 전체 모델 보기

로컬 실행

로컬 배포 완전 가이드

가이드 읽기

API 접근

호스팅된 API로 대신 사용

시작하기

파인튜닝

특정 작업에 맞게 커스터마이즈

전체 모델

모든 Gemma 4 변형 비교

비교하기

커뮤니티

Gemma로 개발하는 개발자들과 함께

탐색하기

모델 카드

기술 사양

보기

시작하기

Gemma 4를 다운로드하고 개발을 시작하세요

먼저 온라인으로 체험하거나, 프라이빗 로컬 배포를 위해 직접 다운로드하세요. Apache 2.0 라이선스로 완전한 상업적 자유.

먼저 온라인으로 체험 Hugging Face에서 다운로드

Gemma 4 공식 가중치 다운로드 - Apache 2.0 라이선스

하드웨어에 맞는 모델 선택하기

다운로드 가능한 모든 Gemma 4 변형

다양한 포맷과 양자화 수준

Gemma 4 E2B

Gemma 4 E4B

Gemma 4 26B A4B

Gemma 4 31B

공식 다운로드 플랫폼

Hugging Face

Kaggle

Ollama

Google AI Studio

GGUF 포맷

ONNX 포맷

가장 빠르게 시작하는 방법

모델 및 양자화별 파일 크기

다운로드 및 메모리 요구 사항

Apache 2.0 라이선스로 완전한 상업적 자유

GGUF, ONNX, SafeTensors 등

공식 검증된 소스에서만 다운로드

검증된 플랫폼에서 다운로드

다운로드 후 실행하기

기술 레퍼런스

Gemma 4 가중치 활용 방법

로컬 실행

API 접근

파인튜닝

전체 모델

커뮤니티

모델 카드

Gemma 4를 다운로드하고 개발을 시작하세요