Gemma 4 26B A4B
26 milliards de paramètres, 4 milliards actifs - l'intelligence de pointe à la vitesse d'inférence
Gemma 4 26B A4B est un modèle Mixture-of-Experts qui n'active que 4B de paramètres par token tout en offrant une qualité proche du 31B. Avec un contexte de 256K, plus de 140 langues et 88.3% sur AIME 2026, c'est la voie la plus efficiente vers un raisonnement de classe mondiale.
Variantes du modèle
Modèles instruction-tuned et de base
Choisissez entre la variante instruction-tuned optimisée pour le chat et l'exécution de tâches, ou le modèle de base pour le fine-tuning et les applications spécialisées.
Architecture Mixture-of-Experts
25.2B de paramètres totaux, 3.8B actifs par token
Gemma 4 26B A4B utilise une architecture MoE éparse avec 8 experts actifs sur 128 au total, plus 1 expert partagé. Les 26B de paramètres sont chargés en mémoire pour un routage rapide, mais le coût d'inférence reste proche d'un modèle dense de 4B.
Idéal pour les déploiements en production à haut débit nécessitant une qualité proche du 31B à une fraction du coût de calcul.
Instruction-tuned
26B Instruct
Optimisé pour l'IA conversationnelle et l'exécution de tâches complexes
Affiné avec RLHF pour le suivi d'instructions et le dialogue multi-tours
Pré-entraîné
26B Base
Modèle MoE de base pour le fine-tuning et les applications spécialisées
Pré-entraîné sur des données multimodales diversifiées avec routage d'experts épars
Capacités
Performances de pointe au coût d'inférence de 4B
Gemma 4 26B A4B combine l'efficience MoE avec un raisonnement avancé, des capacités de programmation exceptionnelles et une compréhension multimodale - offrant une qualité proche du 31B à une fraction du coût de calcul.
Efficience MoE
N'active que 3.8B de paramètres par token sur un total de 25.2B. Une qualité proche du 31B au coût d'inférence d'environ 4B - le meilleur ratio d'efficience de la famille Gemma 4.
Raisonnement avancé
Le mode de réflexion configurable permet un raisonnement étape par étape. Atteint 88.3% sur AIME 2026 en mathématiques - à seulement 0.9 point du modèle dense 31B.
Excellence en programmation
77.1% sur LiveCodeBench v6 et 1718 Codeforces ELO. Appel de fonctions natif pour les workflows agentiques et l'exécution autonome de code.
Fenêtre de contexte de 256K
Contexte étendu pour les bases de code complètes, les documents longs et les conversations multi-tours. Attention hybride locale/globale pour une utilisation efficiente de la mémoire.
Compréhension multimodale
Traite le texte et les images avec des rapports d'aspect variables. 73.8% sur MMMU Pro et 82.4% sur MATH-Vision pour le raisonnement visuel.
Plus de 140 langues
Prise en charge multilingue avec compréhension du contexte culturel. 82.6% sur MMLU Pro dans divers domaines de connaissances.
Points clés
Des métriques de performance exceptionnelles
Gemma 4 26B A4B atteint des résultats proches du 31B sur divers benchmarks tout en n'activant que 3.8B de paramètres par token.
Résultats majeurs
- Arena AI ELO 1441 - compétitif avec le modèle dense 31B
- 88.3% sur AIME 2026 en mathématiques (sans outils)
- 77.1% sur LiveCodeBench v6 en programmation
- 82.3% sur GPQA Diamond en connaissances scientifiques
- 85.5% sur t2-bench en utilisation d'outils agentiques
Spécifications techniques
- 25.2B de paramètres totaux, 3.8B actifs par token
- 8 experts actifs + 1 expert partagé sur 128 au total
- Fenêtre de contexte de 256K tokens
- Prise en charge de plus de 140 langues
- Mécanisme d'attention hybride locale/globale
Performances
Une qualité proche du 31B au coût d'inférence de 4B
Gemma 4 26B A4B atteint 88.3% sur AIME 2026 et 82.6% sur MMLU Pro - à moins de 1% du modèle dense 31B - tout en n'activant que 3.8B de paramètres par token.
Gemma 4 26B A4B démontre une excellence constante en raisonnement, programmation, multimodal et benchmarks agentiques - à 1-3% du modèle dense 31B sur chaque tâche.
Arena AI ELO 1441 - compétitif avec le modèle dense 31B
88.3% sur AIME 2026 en mathématiques (sans outils)
77.1% sur LiveCodeBench v6 en programmation compétitive
82.3% sur GPQA Diamond en connaissances scientifiques
85.5% sur t2-bench en utilisation d'outils agentiques
Comparaison des benchmarks
26B MoE vs 31B Dense et la famille Gemma 4
Gemma 4 26B A4B offre des performances proches du 31B en raisonnement, programmation, multimodal et tâches agentiques à une fraction du coût d'inférence.
| Benchmark | Gemma 4 26B A4B IT Thinking En vedette | Gemma 4 31B IT Thinking | Gemma 4 E4B IT Thinking | Gemma 3 27B IT |
|---|---|---|---|---|
Arena AI (text) Au 2 avril 2026 | 1441 | 1452 | - | 1365 |
MMLU Pro Connaissances et raisonnement Sans outils | 82.6% | 85.2% | 69.4% | 67.6% |
MMMU Pro Raisonnement multimodal | 73.8% | 76.9% | 52.6% | 49.7% |
AIME 2026 Mathématiques Sans outils | 88.3% | 89.2% | 42.5% | 20.8% |
LiveCodeBench v6 Programmation compétitive | 77.1% | 80.0% | 52.0% | 29.1% |
GPQA Diamond Connaissances scientifiques Sans outils | 82.3% | 84.3% | 58.6% | 42.4% |
t2-bench Utilisation d'outils agentiques Retail | 85.5% | 86.4% | 57.5% | 6.6% |
Résultats des benchmarks issus de la fiche officielle du modèle Gemma 4. Scores Arena AI au 2 avril 2026.
Architecture MoE
Capacité de 26B, coût d'inférence de 4B
L'architecture Mixture-of-Experts achemine chaque token à travers 8 des 128 experts, plus 1 expert partagé. Les 26B de paramètres restent en mémoire pour un routage instantané, mais seuls 3.8B s'activent par passe - offrant une qualité proche du 31B à une fraction du coût de calcul.
- 3.8B de paramètres actifs par token sur une capacité totale de 25.2B
- 8 experts actifs + 1 expert partagé sur 128 experts au total
- p-RoPE proportionnel pour une gestion efficiente du contexte de 256K
Raisonnement avancé
88.3% sur AIME 2026 - à moins de 1% du modèle 31B
Le mode de réflexion configurable permet un raisonnement transparent étape par étape pour les mathématiques, la logique et la résolution de problèmes en plusieurs étapes. Le MoE 26B réduit l'écart avec le modèle dense 31B à moins d'un point de pourcentage sur les benchmarks mathématiques les plus exigeants.
- 88.3% sur AIME 2026 en mathématiques (sans outils)
- 82.3% sur GPQA Diamond en sciences de niveau avancé
- Mode de raisonnement intégré avec explications étape par étape
Excellence en programmation
77.1% sur LiveCodeBench v6 avec appel de fonctions natif
Avec 77.1% sur LiveCodeBench v6 et 1718 Codeforces ELO, Gemma 4 26B A4B excelle en génération de code, débogage et workflows agentiques. L'appel de fonctions natif permet de créer des agents autonomes sans fine-tuning.
- 77.1% sur les problèmes de programmation compétitive LiveCodeBench v6
- 1718 Codeforces ELO rating
- Appel de fonctions natif pour les agents autonomes
Compréhension multimodale
Traitement de texte et d'images avec résolution variable
Traitez le texte et les images ensemble avec la prise en charge de rapports d'aspect et de résolutions variables. 73.8% sur MMMU Pro et 82.4% sur MATH-Vision démontrent de solides capacités de raisonnement visuel et de compréhension de documents.
- 73.8% sur MMMU Pro en raisonnement multimodal
- 82.4% sur MATH-Vision en problèmes mathématiques visuels
- Prise en charge de résolutions d'image variables (70-1120 tokens)
Pour commencer
Essayez Gemma 4 26B maintenant
Commencez à discuter instantanément, ou téléchargez les poids pour un déploiement auto-hébergé.
Télécharger les poids
Déploiement auto-hébergé
Téléchargez les poids officiels du modèle pour un déploiement sur votre infrastructure.
Déployer et mettre à l'échelle
Options de déploiement en production
Déploiement prêt pour l'entreprise sur Google Cloud, Kubernetes ou votre propre infrastructure.
Rejoignez le Gemmaverse
Partie intégrante de l'écosystème Gemma
Gemma 4 26B A4B fait partie de la famille de modèles ouverts de Google, avec un vaste soutien communautaire, des intégrations et des ressources.
Pour commencer
Prêt à construire avec Gemma 4 26B A4B ?
Commencez à discuter gratuitement dès maintenant, ou téléchargez le modèle pour un déploiement auto-hébergé sur votre infrastructure.