Gemma 4 API

Accede a Gemma 4 a través de API alojadas: sin infraestructura que administrar

Usa los modelos Gemma 4 a través de Google AI Studio, Gemini API, Vertex AI u OpenRouter. Acceso instantáneo, niveles gratuitos disponibles y escalado listo para producción sin administrar GPU ni pesos de modelo.

Proveedores de API

Múltiples vías de acceso a la API de Gemma 4

Elige el proveedor de API que se adapte a tus necesidades. Desde prototipado gratuito hasta producción a escala empresarial.

Proveedores de API

Acceso alojado a todos los modelos Gemma 4

Google AI Studio ofrece acceso gratuito para prototipado. Vertex AI proporciona despliegue de nivel empresarial. OpenRouter y otros proveedores ofrecen acceso por token con endpoints compatibles con OpenAI.

Todos los proveedores soportan las variantes instruction-tuned. Algunos también ofrecen modelos base para ajuste fino a través de la API.

Nivel gratuito disponible

Google AI Studio

Acceso API gratuito para prototipado y desarrollo. Límites de solicitudes generosos para comenzar.

Compatible con Gemini API. Soporta todas las variantes Gemma 4 IT. Nivel gratuito con límites de solicitudes.

Gratuito para comenzar

Empresarial

Vertex AI

Despliegue de nivel producción en Google Cloud. Con SLA garantizado, escalable y seguro.

Endpoints administrados, autoescalado, soporte VPC y funciones de seguridad empresarial.

Pago por uso

Pago por token

OpenRouter

API compatible con OpenAI. Sustitución directa para integraciones existentes.

Precios sencillos por token. Compatible con cualquier SDK o biblioteca cliente de OpenAI.

Pago por token

Control total

API autoalojada

Ejecuta tu propia API con vLLM, TGI u Ollama. Control completo sobre la infraestructura.

Endpoints compatibles con OpenAI a través de vLLM u Ollama. Despliega en tus propias GPU.

Tu infraestructura

Funciones de la API

Qué puedes hacer con la API de Gemma 4

La API de Gemma 4 soporta generación de texto, entrada multimodal, llamada a funciones y respuestas en streaming.

Generación de texto

Completado de chat, generación de texto y seguimiento de instrucciones. Soporta prompts de sistema, conversaciones multiturn y modos de razonamiento configurables.

Entrada multimodal

Envía imágenes junto con texto para comprensión visual, análisis de documentos e interpretación de gráficos. Soporte de resolución variable.

Llamada a funciones

Llamada a funciones nativa para construir agentes. Define esquemas de herramientas, recibe llamadas JSON estructuradas y construye flujos de trabajo autónomos.

Streaming

Server-sent events para streaming de tokens en tiempo real. Construye interfaces de chat responsivas con retroalimentación instantánea.

Procesamiento por lotes

Procesa grandes volúmenes de solicitudes de forma eficiente. Ideal para procesamiento de datos, generación de contenido y pipelines de evaluación.

API de ajuste fino

Ajusta los modelos Gemma 4 a través de Vertex AI o en local. Personaliza para tu dominio y tareas específicas.

Inicio rápido

Tu primera llamada API en 30 segundos

Obtén una clave API de Google AI Studio y haz tu primera llamada con curl o cualquier cliente HTTP.

Google AI Studio

  • 1. Visita aistudio.google.com e inicia sesión
  • 2. Crea una clave API (gratis)
  • 3. Usa el endpoint de Gemini API con tu clave
  • 4. Nombre del modelo: gemma-4-31b-it o gemma-4-26b-a4b-it
  • 5. Compatible con SDK de OpenAI (cambia la URL base)

OpenRouter

  • 1. Regístrate en openrouter.ai
  • 2. Agrega créditos (pago por token)
  • 3. Usa el endpoint compatible con OpenAI
  • 4. Modelo: google/gemma-4-31b-it
  • 5. Sustitución directa del código OpenAI existente

Rendimiento de la API

Latencia y rendimiento entre proveedores

El rendimiento de la API varía según el proveedor, el tamaño del modelo y la complejidad de las solicitudes. Esto es lo que puedes esperar.

Las API alojadas administran el escalado de infraestructura automáticamente. Elige según tus requisitos de latencia, rendimiento y costo.

Comparación de rendimiento de la API Gemma 4 entre proveedores

Google AI Studio: nivel gratuito con límites de solicitudes generosos para prototipado

Vertex AI: SLA empresarial con autoescalado y endpoints de baja latencia

OpenRouter: pago por token con API compatible con OpenAI

Autoalojado: control total sobre latencia y rendimiento

Comparación de proveedores

Proveedores de API de un vistazo

Compara precios, funciones y compatibilidad de los proveedores de API de Gemma 4.

Benchmark
AI Studio
Gratis
Vertex AI
Empresarial
OpenRouter
Por token
Autoalojado
DIY
Free tier
Para comenzar
Créditos de pruebaNoTu costo
OpenAI compatible
Compatibilidad SDK
ParcialSí (vLLM)
Function calling
Soporte de herramientas
Multimodal
Entrada de imagen
SLA
Garantía de disponibilidad
No99.9%NoTu SLA
Best for
Caso de uso
PrototipadoProducciónIntegraciónControl total

Precios y funciones a fecha de abril de 2026. Consulta los sitios web de los proveedores para información actualizada.

Acceso gratuito

Comienza a desarrollar con la API de Gemma 4 gratis

Google AI Studio proporciona acceso API gratuito a todos los modelos Gemma 4 instruction-tuned. Sin tarjeta de crédito. Límites de solicitudes generosos para prototipado y desarrollo.

  • Clave API gratuita de Google AI Studio
  • Todos los modelos Gemma 4 IT disponibles
  • Límites de solicitudes generosos para desarrollo
Comienza a desarrollar con la API de Gemma 4 gratis

Compatible con OpenAI

Sustitución directa del código OpenAI existente

La API de Gemini y OpenRouter soportan endpoints compatibles con OpenAI. Cambia la URL base y el nombre del modelo en tu código existente: todo lo demás sigue igual.

  • Mismo SDK, mismo formato, modelo diferente
  • Funciona con LangChain, LlamaIndex y otros frameworks
  • Streaming, llamada a funciones y multimodal totalmente compatibles
Sustitución directa del código OpenAI existente

Listo para empresas

Despliegue en producción con Vertex AI

Vertex AI proporciona despliegue empresarial de Gemma 4 con garantías SLA, autoescalado, soporte VPC y certificaciones de cumplimiento. Despliega con confianza.

  • SLA de disponibilidad del 99.9%
  • Autoescalado según la demanda
  • Soporte VPC y endpoint privado
Despliegue en producción con Vertex AI

Ecosistema API

Desarrolla con las API de Gemma 4

Un ecosistema creciente de herramientas y frameworks soporta la integración de la API de Gemma 4.

Google AI Studio

Acceso API gratuito para prototipado

Obtener clave

Vertex AI

Despliegue de nivel empresarial

Desplegar

OpenRouter

Acceso por token

Registrarse

LangChain

Guía de integración de framework

Integrar

LlamaIndex

Framework RAG y datos

Desarrollar

Autoalojado

Ejecuta tu propio servidor API

Desplegar

Comenzar

Comienza a desarrollar con la API de Gemma 4 hoy mismo

Obtén una clave API gratuita de Google AI Studio o prueba Gemma 4 primero a través de nuestra interfaz de chat. Sin tarjeta de crédito.