Gemma 4 API

Accédez à Gemma 4 via des API hébergées - aucune infrastructure à gérer

Utilisez les modèles Gemma 4 via Google AI Studio, Gemini API, Vertex AI ou OpenRouter. Accès instantané, offres gratuites disponibles et mise à l'échelle prête pour la production sans gérer de GPU ni de poids de modèle.

Fournisseurs d'API

Plusieurs chemins vers l'API Gemma 4

Choisissez le fournisseur d'API adapté à vos besoins. Du prototypage gratuit à la production à l'échelle entreprise.

Fournisseurs d'API

Accès hébergé à tous les modèles Gemma 4

Google AI Studio offre un accès gratuit pour le prototypage. Vertex AI fournit un déploiement de niveau entreprise. OpenRouter et d'autres fournisseurs proposent un accès au token avec des endpoints compatibles OpenAI.

Tous les fournisseurs prennent en charge les variantes instruction-tuned. Certains proposent également des modèles de base pour le fine-tuning via API.

Offre gratuite disponible

Google AI Studio

Accès API gratuit pour le prototypage et le développement. Limites de requêtes généreuses pour démarrer.

Compatible Gemini API. Prend en charge toutes les variantes Gemma 4 IT. Offre gratuite avec limites de requêtes.

Gratuit pour commencer

Entreprise

Vertex AI

Déploiement de niveau production sur Google Cloud. Garanti par SLA, évolutif et sécurisé.

Endpoints gérés, mise à l'échelle automatique, support VPC et fonctionnalités de sécurité entreprise.

Paiement à l'usage

Paiement au token

OpenRouter

API compatible OpenAI. Remplacement direct pour les intégrations existantes.

Tarification simple au token. Compatible avec tout SDK ou bibliothèque client OpenAI.

Paiement au token

Contrôle total

API auto-hébergée

Exécutez votre propre API avec vLLM, TGI ou Ollama. Contrôle complet de l'infrastructure.

Endpoints compatibles OpenAI via vLLM ou Ollama. Déployez sur vos propres GPU.

Votre infrastructure

Fonctionnalités API

Ce que vous pouvez faire avec l'API Gemma 4

L'API Gemma 4 prend en charge la génération de texte, l'entrée multimodale, l'appel de fonctions et les réponses en streaming.

Génération de texte

Complétions de chat, génération de texte et suivi d'instructions. Prend en charge les prompts système, les conversations multi-tours et les modes de réflexion configurables.

Entrée multimodale

Envoyez des images avec du texte pour la compréhension visuelle, l'analyse de documents et l'interprétation de graphiques. Support de résolution variable.

Appel de fonctions

Appel de fonctions natif pour la construction d'agents. Définissez des schémas d'outils, recevez des appels JSON structurés et construisez des workflows autonomes.

Streaming

Server-sent events pour le streaming de tokens en temps réel. Construisez des interfaces de chat réactives avec un retour instantané.

Traitement par lots

Traitez efficacement de grands volumes de requêtes. Idéal pour le traitement de données, la génération de contenu et les pipelines d'évaluation.

API de fine-tuning

Affinez les modèles Gemma 4 via Vertex AI ou en local. Personnalisez pour votre domaine et vos tâches spécifiques.

Démarrage rapide

Votre premier appel API en 30 secondes

Obtenez une clé API de Google AI Studio et faites votre premier appel avec curl ou n'importe quel client HTTP.

Google AI Studio

  • 1. Visitez aistudio.google.com et connectez-vous
  • 2. Créez une clé API (gratuit)
  • 3. Utilisez l'endpoint Gemini API avec votre clé
  • 4. Nom du modèle : gemma-4-31b-it ou gemma-4-26b-a4b-it
  • 5. Compatible avec le SDK OpenAI (changez l'URL de base)

OpenRouter

  • 1. Inscrivez-vous sur openrouter.ai
  • 2. Ajoutez des crédits (paiement au token)
  • 3. Utilisez l'endpoint compatible OpenAI
  • 4. Modèle : google/gemma-4-31b-it
  • 5. Remplacement direct du code OpenAI existant

Performances API

Latence et débit selon les fournisseurs

Les performances API varient selon le fournisseur, la taille du modèle et la complexité des requêtes. Voici ce à quoi vous pouvez vous attendre.

Les API hébergées gèrent automatiquement la mise à l'échelle de l'infrastructure. Choisissez en fonction de vos exigences de latence, débit et coût.

Comparaison des performances de l'API Gemma 4 entre fournisseurs

Google AI Studio : offre gratuite avec des limites de requêtes généreuses pour le prototypage

Vertex AI : SLA entreprise avec mise à l'échelle automatique et endpoints à faible latence

OpenRouter : paiement au token avec API compatible OpenAI

Auto-hébergé : contrôle total sur la latence et le débit

Comparaison des fournisseurs

Les fournisseurs d'API en un coup d'œil

Comparez les tarifs, fonctionnalités et compatibilité des fournisseurs d'API Gemma 4.

Benchmark
AI Studio
Gratuit
Vertex AI
Entreprise
OpenRouter
Par token
Auto-hébergé
DIY
Free tier
Pour commencer
OuiCrédits d'essaiNonVos coûts
OpenAI compatible
Compatibilité SDK
OuiPartielOuiOui (vLLM)
Function calling
Support d'outils
OuiOuiOuiOui
Multimodal
Entrée image
OuiOuiOuiOui
SLA
Garantie de disponibilité
Non99,9 %NonVotre SLA
Best for
Cas d'usage
PrototypageProductionIntégrationContrôle total

Tarifs et fonctionnalités en date d'avril 2026. Consultez les sites des fournisseurs pour les informations actuelles.

Accès gratuit

Commencez à développer avec l'API Gemma 4 gratuitement

Google AI Studio fournit un accès API gratuit à tous les modèles Gemma 4 instruction-tuned. Aucune carte de crédit requise. Limites de requêtes généreuses pour le prototypage et le développement.

  • Clé API gratuite de Google AI Studio
  • Tous les modèles Gemma 4 IT disponibles
  • Limites de requêtes généreuses pour le développement
Commencez à développer avec l'API Gemma 4 gratuitement

Compatible OpenAI

Remplacement direct du code OpenAI existant

L'API Gemini et OpenRouter prennent tous deux en charge les endpoints compatibles OpenAI. Changez l'URL de base et le nom du modèle dans votre code existant - tout le reste reste identique.

  • Même SDK, même format, modèle différent
  • Fonctionne avec LangChain, LlamaIndex et d'autres frameworks
  • Streaming, appel de fonctions et multimodal entièrement compatibles
Remplacement direct du code OpenAI existant

Prêt pour l'entreprise

Déploiement en production avec Vertex AI

Vertex AI fournit un déploiement Gemma 4 de niveau entreprise avec garanties SLA, mise à l'échelle automatique, support VPC et certifications de conformité. Déployez en toute confiance.

  • SLA de disponibilité à 99,9 %
  • Mise à l'échelle automatique selon la demande
  • Support VPC et endpoint privé
Déploiement en production avec Vertex AI

Écosystème API

Développez avec les API Gemma 4

Un écosystème croissant d'outils et de frameworks prend en charge l'intégration de l'API Gemma 4.

Google AI Studio

Accès API gratuit pour le prototypage

Obtenir la clé

Vertex AI

Déploiement de niveau entreprise

Déployer

OpenRouter

Accès au token

S'inscrire

LangChain

Guide d'intégration framework

Intégrer

LlamaIndex

Framework RAG et données

Développer

Auto-hébergé

Exécutez votre propre serveur API

Déployer

Commencer

Commencez à développer avec l'API Gemma 4 dès aujourd'hui

Obtenez une clé API gratuite de Google AI Studio, ou essayez d'abord Gemma 4 via notre interface de chat. Aucune carte de crédit requise.