Gemma 4 API
Accede a Gemma 4 a través de API alojadas: sin infraestructura que administrar
Usa los modelos Gemma 4 a través de Google AI Studio, Gemini API, Vertex AI u OpenRouter. Acceso instantáneo, niveles gratuitos disponibles y escalado listo para producción sin administrar GPU ni pesos de modelo.
Proveedores de API
Múltiples vías de acceso a la API de Gemma 4
Elige el proveedor de API que se adapte a tus necesidades. Desde prototipado gratuito hasta producción a escala empresarial.
Proveedores de API
Acceso alojado a todos los modelos Gemma 4
Google AI Studio ofrece acceso gratuito para prototipado. Vertex AI proporciona despliegue de nivel empresarial. OpenRouter y otros proveedores ofrecen acceso por token con endpoints compatibles con OpenAI.
Todos los proveedores soportan las variantes instruction-tuned. Algunos también ofrecen modelos base para ajuste fino a través de la API.
Nivel gratuito disponible
Google AI Studio
Acceso API gratuito para prototipado y desarrollo. Límites de solicitudes generosos para comenzar.
Compatible con Gemini API. Soporta todas las variantes Gemma 4 IT. Nivel gratuito con límites de solicitudes.
Empresarial
Vertex AI
Despliegue de nivel producción en Google Cloud. Con SLA garantizado, escalable y seguro.
Endpoints administrados, autoescalado, soporte VPC y funciones de seguridad empresarial.
Pago por token
OpenRouter
API compatible con OpenAI. Sustitución directa para integraciones existentes.
Precios sencillos por token. Compatible con cualquier SDK o biblioteca cliente de OpenAI.
Control total
API autoalojada
Ejecuta tu propia API con vLLM, TGI u Ollama. Control completo sobre la infraestructura.
Endpoints compatibles con OpenAI a través de vLLM u Ollama. Despliega en tus propias GPU.
Funciones de la API
Qué puedes hacer con la API de Gemma 4
La API de Gemma 4 soporta generación de texto, entrada multimodal, llamada a funciones y respuestas en streaming.
Generación de texto
Completado de chat, generación de texto y seguimiento de instrucciones. Soporta prompts de sistema, conversaciones multiturn y modos de razonamiento configurables.
Entrada multimodal
Envía imágenes junto con texto para comprensión visual, análisis de documentos e interpretación de gráficos. Soporte de resolución variable.
Llamada a funciones
Llamada a funciones nativa para construir agentes. Define esquemas de herramientas, recibe llamadas JSON estructuradas y construye flujos de trabajo autónomos.
Streaming
Server-sent events para streaming de tokens en tiempo real. Construye interfaces de chat responsivas con retroalimentación instantánea.
Procesamiento por lotes
Procesa grandes volúmenes de solicitudes de forma eficiente. Ideal para procesamiento de datos, generación de contenido y pipelines de evaluación.
API de ajuste fino
Ajusta los modelos Gemma 4 a través de Vertex AI o en local. Personaliza para tu dominio y tareas específicas.
Inicio rápido
Tu primera llamada API en 30 segundos
Obtén una clave API de Google AI Studio y haz tu primera llamada con curl o cualquier cliente HTTP.
Google AI Studio
- 1. Visita aistudio.google.com e inicia sesión
- 2. Crea una clave API (gratis)
- 3. Usa el endpoint de Gemini API con tu clave
- 4. Nombre del modelo: gemma-4-31b-it o gemma-4-26b-a4b-it
- 5. Compatible con SDK de OpenAI (cambia la URL base)
OpenRouter
- 1. Regístrate en openrouter.ai
- 2. Agrega créditos (pago por token)
- 3. Usa el endpoint compatible con OpenAI
- 4. Modelo: google/gemma-4-31b-it
- 5. Sustitución directa del código OpenAI existente
Rendimiento de la API
Latencia y rendimiento entre proveedores
El rendimiento de la API varía según el proveedor, el tamaño del modelo y la complejidad de las solicitudes. Esto es lo que puedes esperar.
Las API alojadas administran el escalado de infraestructura automáticamente. Elige según tus requisitos de latencia, rendimiento y costo.


Google AI Studio: nivel gratuito con límites de solicitudes generosos para prototipado
Vertex AI: SLA empresarial con autoescalado y endpoints de baja latencia
OpenRouter: pago por token con API compatible con OpenAI
Autoalojado: control total sobre latencia y rendimiento
Comparación de proveedores
Proveedores de API de un vistazo
Compara precios, funciones y compatibilidad de los proveedores de API de Gemma 4.
| Benchmark | AI Studio Gratis | Vertex AI Empresarial | OpenRouter Por token | Autoalojado DIY |
|---|---|---|---|---|
Free tier Para comenzar | Sí | Créditos de prueba | No | Tu costo |
OpenAI compatible Compatibilidad SDK | Sí | Parcial | Sí | Sí (vLLM) |
Function calling Soporte de herramientas | Sí | Sí | Sí | Sí |
Multimodal Entrada de imagen | Sí | Sí | Sí | Sí |
SLA Garantía de disponibilidad | No | 99.9% | No | Tu SLA |
Best for Caso de uso | Prototipado | Producción | Integración | Control total |
Precios y funciones a fecha de abril de 2026. Consulta los sitios web de los proveedores para información actualizada.
Acceso gratuito
Comienza a desarrollar con la API de Gemma 4 gratis
Google AI Studio proporciona acceso API gratuito a todos los modelos Gemma 4 instruction-tuned. Sin tarjeta de crédito. Límites de solicitudes generosos para prototipado y desarrollo.
- Clave API gratuita de Google AI Studio
- Todos los modelos Gemma 4 IT disponibles
- Límites de solicitudes generosos para desarrollo
Compatible con OpenAI
Sustitución directa del código OpenAI existente
La API de Gemini y OpenRouter soportan endpoints compatibles con OpenAI. Cambia la URL base y el nombre del modelo en tu código existente: todo lo demás sigue igual.
- Mismo SDK, mismo formato, modelo diferente
- Funciona con LangChain, LlamaIndex y otros frameworks
- Streaming, llamada a funciones y multimodal totalmente compatibles
Listo para empresas
Despliegue en producción con Vertex AI
Vertex AI proporciona despliegue empresarial de Gemma 4 con garantías SLA, autoescalado, soporte VPC y certificaciones de cumplimiento. Despliega con confianza.
- SLA de disponibilidad del 99.9%
- Autoescalado según la demanda
- Soporte VPC y endpoint privado
Obtener acceso a la API
Comienza a usar la API de Gemma 4
Elige tu proveedor y comienza en minutos.
Documentación
Referencias y guías de la API
Documentación completa para integrar las API de Gemma 4.
Autoalojado
Ejecuta tu propia API
Despliega Gemma 4 como API en tu propia infraestructura.
Ecosistema API
Desarrolla con las API de Gemma 4
Un ecosistema creciente de herramientas y frameworks soporta la integración de la API de Gemma 4.
Comenzar
Comienza a desarrollar con la API de Gemma 4 hoy mismo
Obtén una clave API gratuita de Google AI Studio o prueba Gemma 4 primero a través de nuestra interfaz de chat. Sin tarjeta de crédito.