Gemma 4 API

호스팅 API로 Gemma 4에 액세스 - 인프라 관리 불필요

Google AI Studio, Gemini API, Vertex AI 또는 OpenRouter를 통해 Gemma 4 모델을 사용하세요. 즉시 액세스, 무료 티어 제공, GPU나 모델 가중치 관리 없이 프로덕션 수준의 스케일링.

무료로 채팅 시작 API 옵션 보기

API 제공업체

Gemma 4 API에 접근하는 다양한 방법

필요에 맞는 API 제공업체를 선택하세요. 무료 프로토타이핑부터 엔터프라이즈 규모의 프로덕션까지.

API 제공업체

모든 Gemma 4 모델에 대한 호스팅 액세스

Google AI Studio는 프로토타이핑을 위한 무료 액세스를 제공합니다. Vertex AI는 엔터프라이즈급 배포를 제공합니다. OpenRouter 및 기타 제공업체는 OpenAI 호환 엔드포인트로 토큰당 과금 액세스를 제공합니다.

모든 제공업체가 instruction-tuned 변형을 지원합니다. 일부는 API를 통한 파인튜닝용 베이스 모델도 제공합니다.

무료로 시작 제공업체 비교

무료 티어 제공

Google AI Studio

프로토타이핑 및 개발을 위한 무료 API 액세스. 시작하기에 충분한 요청 제한.

Gemini API 호환. 모든 Gemma 4 IT 변형 지원. 요청 제한이 있는 무료 티어.

무료로 시작

API 키 받기 문서

엔터프라이즈

Vertex AI

Google Cloud의 프로덕션급 배포. SLA 보장, 확장 가능, 보안.

관리형 엔드포인트, 자동 스케일링, VPC 지원, 엔터프라이즈 보안 기능.

사용량 기반 과금

Vertex에 배포 요금

토큰당 과금

OpenRouter

OpenAI 호환 API. 기존 통합에 바로 대체 가능.

간단한 토큰당 과금. 모든 OpenAI SDK 또는 클라이언트 라이브러리와 호환.

토큰당 과금

시작하기 요금

완전한 제어

셀프 호스팅 API

vLLM, TGI 또는 Ollama로 자체 API를 운영. 인프라에 대한 완전한 제어.

vLLM 또는 Ollama를 통한 OpenAI 호환 엔드포인트. 자체 GPU에 배포.

자체 인프라

vLLM 가이드 Ollama 가이드

API 기능

Gemma 4 API로 할 수 있는 것

Gemma 4 API는 텍스트 생성, 멀티모달 입력, 함수 호출, 스트리밍 응답을 지원합니다.

텍스트 생성

채팅 완성, 텍스트 생성, 지시 따르기. 시스템 프롬프트, 멀티턴 대화, 설정 가능한 사고 모드 지원.

멀티모달 입력

텍스트와 함께 이미지를 전송하여 시각적 이해, 문서 분석, 차트 해석 가능. 가변 해상도 지원.

함수 호출

에이전트 구축을 위한 네이티브 함수 호출. 도구 스키마를 정의하고, 구조화된 JSON 호출을 받고, 자율적인 워크플로를 구축.

스트리밍

실시간 토큰 스트리밍을 위한 Server-sent events. 즉각적인 피드백이 있는 반응형 채팅 인터페이스 구축.

배치 처리

대량의 요청을 효율적으로 처리. 데이터 처리, 콘텐츠 생성, 평가 파이프라인에 이상적.

파인튜닝 API

Vertex AI 또는 로컬에서 Gemma 4 모델을 파인튜닝. 특정 도메인과 작업에 맞게 커스터마이징.

빠른 시작

30초 만에 첫 API 호출

Google AI Studio에서 API 키를 받고 curl이나 HTTP 클라이언트로 첫 호출을 실행하세요.

Google AI Studio

1. aistudio.google.com에 방문하여 로그인
2. API 키 생성 (무료)
3. 키를 사용하여 Gemini API 엔드포인트 이용
4. 모델명: gemma-4-31b-it 또는 gemma-4-26b-a4b-it
5. OpenAI SDK와 호환 (베이스 URL 변경)

OpenRouter

1. openrouter.ai에서 가입
2. 크레딧 추가 (토큰당 과금)
3. OpenAI 호환 엔드포인트 사용
4. 모델: google/gemma-4-31b-it
5. 기존 OpenAI 코드에 바로 대체 가능

무료 API 키 받기 문서 보기

API 성능

제공업체별 지연 시간 및 처리량

API 성능은 제공업체, 모델 크기, 요청 복잡도에 따라 다릅니다. 기대할 수 있는 수준을 소개합니다.

호스팅 API는 인프라 스케일링을 자동으로 처리합니다. 지연 시간, 처리량, 비용 요구사항에 따라 선택하세요.

무료로 시작 제공업체 비교

Google AI Studio: 프로토타이핑을 위한 충분한 요청 제한의 무료 티어

Vertex AI: 자동 스케일링과 저지연 엔드포인트가 포함된 엔터프라이즈 SLA

OpenRouter: OpenAI 호환 API로 토큰당 과금

셀프 호스팅: 지연 시간과 처리량에 대한 완전한 제어

제공업체 비교

API 제공업체 한눈에 보기

Gemma 4 API 제공업체의 요금, 기능, 호환성을 비교합니다.

Benchmark	AI Studio 무료	Vertex AI 엔터프라이즈	OpenRouter 토큰 과금	셀프 호스팅 DIY
Free tier 시작하기	있음	트라이얼 크레딧	없음	자체 비용
OpenAI compatible SDK 호환성	있음	부분 지원	있음	있음 (vLLM)
Function calling 도구 사용 지원	있음	있음	있음	있음
Multimodal 이미지 입력	있음	있음	있음	있음
SLA 가동률 보장	없음	99.9%	없음	자체 관리
Best for 사용 사례	프로토타이핑	프로덕션	통합	완전한 제어