Gemma 4 API

Acesse o Gemma 4 por APIs hospedadas - sem infraestrutura para gerenciar

Use os modelos Gemma 4 pelo Google AI Studio, Gemini API, Vertex AI ou OpenRouter. Acesso instantâneo, planos gratuitos disponíveis e escalabilidade pronta para produção sem gerenciar GPUs ou pesos de modelo.

Provedores de API

Múltiplos caminhos para acessar a API do Gemma 4

Escolha o provedor de API que atende às suas necessidades. De prototipagem gratuita à produção em escala empresarial.

Provedores de API

Acesso hospedado a todos os modelos Gemma 4

O Google AI Studio oferece acesso gratuito para prototipagem. O Vertex AI fornece implantação de nível empresarial. O OpenRouter e outros provedores oferecem acesso por token com endpoints compatíveis com OpenAI.

Todos os provedores suportam as variantes instruction-tuned. Alguns também oferecem modelos base para fine-tuning via API.

Plano gratuito disponível

Google AI Studio

Acesso API gratuito para prototipagem e desenvolvimento. Limites de requisições generosos para começar.

Compatível com Gemini API. Suporta todas as variantes Gemma 4 IT. Plano gratuito com limites de requisições.

Gratuito para começar

Empresarial

Vertex AI

Implantação de nível produção no Google Cloud. Com SLA garantido, escalável e seguro.

Endpoints gerenciados, auto-scaling, suporte a VPC e recursos de segurança empresarial.

Pagamento por uso

Pagamento por token

OpenRouter

API compatível com OpenAI. Substituição direta para integrações existentes.

Preços simples por token. Compatível com qualquer SDK ou biblioteca cliente OpenAI.

Pagamento por token

Controle total

API auto-hospedada

Execute sua própria API com vLLM, TGI ou Ollama. Controle completo sobre a infraestrutura.

Endpoints compatíveis com OpenAI via vLLM ou Ollama. Implante nas suas próprias GPUs.

Sua infraestrutura

Recursos da API

O que você pode fazer com a API do Gemma 4

A API do Gemma 4 suporta geração de texto, entrada multimodal, chamada de funções e respostas em streaming.

Geração de texto

Completações de chat, geração de texto e seguimento de instruções. Suporta prompts de sistema, conversas multi-turno e modos de raciocínio configuráveis.

Entrada multimodal

Envie imagens junto com texto para compreensão visual, análise de documentos e interpretação de gráficos. Suporte a resolução variável.

Chamada de funções

Chamada de funções nativa para construção de agentes. Defina esquemas de ferramentas, receba chamadas JSON estruturadas e construa fluxos de trabalho autônomos.

Streaming

Server-sent events para streaming de tokens em tempo real. Construa interfaces de chat responsivas com feedback instantâneo.

Processamento em lote

Processe grandes volumes de requisições de forma eficiente. Ideal para processamento de dados, geração de conteúdo e pipelines de avaliação.

API de fine-tuning

Faça fine-tuning dos modelos Gemma 4 via Vertex AI ou localmente. Personalize para seu domínio e tarefas específicas.

Início rápido

Sua primeira chamada de API em 30 segundos

Obtenha uma chave de API do Google AI Studio e faça sua primeira chamada com curl ou qualquer cliente HTTP.

Google AI Studio

  • 1. Acesse aistudio.google.com e faça login
  • 2. Crie uma chave de API (grátis)
  • 3. Use o endpoint da Gemini API com sua chave
  • 4. Nome do modelo: gemma-4-31b-it ou gemma-4-26b-a4b-it
  • 5. Compatível com SDK OpenAI (altere a URL base)

OpenRouter

  • 1. Cadastre-se em openrouter.ai
  • 2. Adicione créditos (pagamento por token)
  • 3. Use o endpoint compatível com OpenAI
  • 4. Modelo: google/gemma-4-31b-it
  • 5. Substituição direta do código OpenAI existente

Desempenho da API

Latência e throughput entre provedores

O desempenho da API varia conforme o provedor, o tamanho do modelo e a complexidade das requisições. Veja o que esperar.

APIs hospedadas gerenciam o escalonamento de infraestrutura automaticamente. Escolha com base nos seus requisitos de latência, throughput e custo.

Comparação de desempenho da API Gemma 4 entre provedores

Google AI Studio: plano gratuito com limites generosos para prototipagem

Vertex AI: SLA empresarial com auto-scaling e endpoints de baixa latência

OpenRouter: pagamento por token com API compatível com OpenAI

Auto-hospedado: controle total sobre latência e throughput

Comparação de provedores

Provedores de API em um relance

Compare preços, recursos e compatibilidade dos provedores de API do Gemma 4.

Benchmark
AI Studio
Grátis
Vertex AI
Empresarial
OpenRouter
Por token
Auto-hospedado
DIY
Free tier
Para começar
SimCréditos de testeNãoSeu custo
OpenAI compatible
Compatibilidade SDK
SimParcialSimSim (vLLM)
Function calling
Suporte a ferramentas
SimSimSimSim
Multimodal
Entrada de imagem
SimSimSimSim
SLA
Garantia de disponibilidade
Não99,9%NãoSeu SLA
Best for
Caso de uso
PrototipagemProduçãoIntegraçãoControle total

Preços e recursos de abril de 2026. Consulte os sites dos provedores para informações atualizadas.

Acesso gratuito

Comece a desenvolver com a API do Gemma 4 gratuitamente

O Google AI Studio fornece acesso API gratuito a todos os modelos Gemma 4 instruction-tuned. Sem cartão de crédito. Limites de requisições generosos para prototipagem e desenvolvimento.

  • Chave de API gratuita do Google AI Studio
  • Todos os modelos Gemma 4 IT disponíveis
  • Limites de requisições generosos para desenvolvimento
Comece a desenvolver com a API do Gemma 4 gratuitamente

Compatível com OpenAI

Substituição direta do código OpenAI existente

A Gemini API e o OpenRouter suportam endpoints compatíveis com OpenAI. Altere a URL base e o nome do modelo no seu código existente - todo o resto permanece igual.

  • Mesmo SDK, mesmo formato, modelo diferente
  • Funciona com LangChain, LlamaIndex e outros frameworks
  • Streaming, chamada de funções e multimodal totalmente compatíveis
Substituição direta do código OpenAI existente

Pronto para empresas

Implantação em produção com Vertex AI

O Vertex AI fornece implantação empresarial do Gemma 4 com garantias de SLA, auto-scaling, suporte a VPC e certificações de conformidade. Implante com confiança.

  • SLA de disponibilidade de 99,9%
  • Auto-scaling baseado na demanda
  • Suporte a VPC e endpoint privado
Implantação em produção com Vertex AI

Ecossistema API

Desenvolva com as APIs do Gemma 4

Um ecossistema crescente de ferramentas e frameworks suporta a integração da API do Gemma 4.

Google AI Studio

Acesso API gratuito para prototipagem

Obter chave

Vertex AI

Implantação de nível empresarial

Implantar

OpenRouter

Acesso por token

Cadastrar

LangChain

Guia de integração de framework

Integrar

LlamaIndex

Framework RAG e dados

Desenvolver

Auto-hospedado

Execute seu próprio servidor API

Implantar

Começar

Comece a desenvolver com a API do Gemma 4 hoje mesmo

Obtenha uma chave de API gratuita do Google AI Studio ou experimente o Gemma 4 primeiro pela nossa interface de chat. Sem cartão de crédito.