Gemma 4 26B A4B

26 milliards de paramètres, 4 milliards actifs - l'intelligence de pointe à la vitesse d'inférence

Gemma 4 26B A4B est un modèle Mixture-of-Experts qui n'active que 4B de paramètres par token tout en offrant une qualité proche du 31B. Avec un contexte de 256K, plus de 140 langues et 88.3% sur AIME 2026, c'est la voie la plus efficiente vers un raisonnement de classe mondiale.

Variantes du modèle

Modèles instruction-tuned et de base

Choisissez entre la variante instruction-tuned optimisée pour le chat et l'exécution de tâches, ou le modèle de base pour le fine-tuning et les applications spécialisées.

Architecture Mixture-of-Experts

25.2B de paramètres totaux, 3.8B actifs par token

Gemma 4 26B A4B utilise une architecture MoE éparse avec 8 experts actifs sur 128 au total, plus 1 expert partagé. Les 26B de paramètres sont chargés en mémoire pour un routage rapide, mais le coût d'inférence reste proche d'un modèle dense de 4B.

Idéal pour les déploiements en production à haut débit nécessitant une qualité proche du 31B à une fraction du coût de calcul.

Instruction-tuned

26B Instruct

Optimisé pour l'IA conversationnelle et l'exécution de tâches complexes

Affiné avec RLHF pour le suivi d'instructions et le dialogue multi-tours

Disponible maintenant

Pré-entraîné

26B Base

Modèle MoE de base pour le fine-tuning et les applications spécialisées

Pré-entraîné sur des données multimodales diversifiées avec routage d'experts épars

Disponible maintenant

Capacités

Performances de pointe au coût d'inférence de 4B

Gemma 4 26B A4B combine l'efficience MoE avec un raisonnement avancé, des capacités de programmation exceptionnelles et une compréhension multimodale - offrant une qualité proche du 31B à une fraction du coût de calcul.

Efficience MoE

N'active que 3.8B de paramètres par token sur un total de 25.2B. Une qualité proche du 31B au coût d'inférence d'environ 4B - le meilleur ratio d'efficience de la famille Gemma 4.

Raisonnement avancé

Le mode de réflexion configurable permet un raisonnement étape par étape. Atteint 88.3% sur AIME 2026 en mathématiques - à seulement 0.9 point du modèle dense 31B.

Excellence en programmation

77.1% sur LiveCodeBench v6 et 1718 Codeforces ELO. Appel de fonctions natif pour les workflows agentiques et l'exécution autonome de code.

Fenêtre de contexte de 256K

Contexte étendu pour les bases de code complètes, les documents longs et les conversations multi-tours. Attention hybride locale/globale pour une utilisation efficiente de la mémoire.

Compréhension multimodale

Traite le texte et les images avec des rapports d'aspect variables. 73.8% sur MMMU Pro et 82.4% sur MATH-Vision pour le raisonnement visuel.

Plus de 140 langues

Prise en charge multilingue avec compréhension du contexte culturel. 82.6% sur MMLU Pro dans divers domaines de connaissances.

Points clés

Des métriques de performance exceptionnelles

Gemma 4 26B A4B atteint des résultats proches du 31B sur divers benchmarks tout en n'activant que 3.8B de paramètres par token.

Résultats majeurs

  • Arena AI ELO 1441 - compétitif avec le modèle dense 31B
  • 88.3% sur AIME 2026 en mathématiques (sans outils)
  • 77.1% sur LiveCodeBench v6 en programmation
  • 82.3% sur GPQA Diamond en connaissances scientifiques
  • 85.5% sur t2-bench en utilisation d'outils agentiques

Spécifications techniques

  • 25.2B de paramètres totaux, 3.8B actifs par token
  • 8 experts actifs + 1 expert partagé sur 128 au total
  • Fenêtre de contexte de 256K tokens
  • Prise en charge de plus de 140 langues
  • Mécanisme d'attention hybride locale/globale

Performances

Une qualité proche du 31B au coût d'inférence de 4B

Gemma 4 26B A4B atteint 88.3% sur AIME 2026 et 82.6% sur MMLU Pro - à moins de 1% du modèle dense 31B - tout en n'activant que 3.8B de paramètres par token.

Gemma 4 26B A4B démontre une excellence constante en raisonnement, programmation, multimodal et benchmarks agentiques - à 1-3% du modèle dense 31B sur chaque tâche.

Graphique comparatif des performances de Gemma 4 26B A4B

Arena AI ELO 1441 - compétitif avec le modèle dense 31B

88.3% sur AIME 2026 en mathématiques (sans outils)

77.1% sur LiveCodeBench v6 en programmation compétitive

82.3% sur GPQA Diamond en connaissances scientifiques

85.5% sur t2-bench en utilisation d'outils agentiques

Comparaison des benchmarks

26B MoE vs 31B Dense et la famille Gemma 4

Gemma 4 26B A4B offre des performances proches du 31B en raisonnement, programmation, multimodal et tâches agentiques à une fraction du coût d'inférence.

Benchmark
Gemma 4 26B A4B IT
Thinking
En vedette
Gemma 4 31B IT
Thinking
Gemma 4 E4B IT
Thinking
Gemma 3 27B IT
Arena AI (text)
Au 2 avril 2026
14411452-1365
MMLU Pro
Connaissances et raisonnement
Sans outils
82.6%85.2%69.4%67.6%
MMMU Pro
Raisonnement multimodal
73.8%76.9%52.6%49.7%
AIME 2026
Mathématiques
Sans outils
88.3%89.2%42.5%20.8%
LiveCodeBench v6
Programmation compétitive
77.1%80.0%52.0%29.1%
GPQA Diamond
Connaissances scientifiques
Sans outils
82.3%84.3%58.6%42.4%
t2-bench
Utilisation d'outils agentiques
Retail
85.5%86.4%57.5%6.6%

Résultats des benchmarks issus de la fiche officielle du modèle Gemma 4. Scores Arena AI au 2 avril 2026.

Architecture MoE

Capacité de 26B, coût d'inférence de 4B

L'architecture Mixture-of-Experts achemine chaque token à travers 8 des 128 experts, plus 1 expert partagé. Les 26B de paramètres restent en mémoire pour un routage instantané, mais seuls 3.8B s'activent par passe - offrant une qualité proche du 31B à une fraction du coût de calcul.

  • 3.8B de paramètres actifs par token sur une capacité totale de 25.2B
  • 8 experts actifs + 1 expert partagé sur 128 experts au total
  • p-RoPE proportionnel pour une gestion efficiente du contexte de 256K
Gemma 4 26B A4B MoE architecture

Raisonnement avancé

88.3% sur AIME 2026 - à moins de 1% du modèle 31B

Le mode de réflexion configurable permet un raisonnement transparent étape par étape pour les mathématiques, la logique et la résolution de problèmes en plusieurs étapes. Le MoE 26B réduit l'écart avec le modèle dense 31B à moins d'un point de pourcentage sur les benchmarks mathématiques les plus exigeants.

  • 88.3% sur AIME 2026 en mathématiques (sans outils)
  • 82.3% sur GPQA Diamond en sciences de niveau avancé
  • Mode de raisonnement intégré avec explications étape par étape
Gemma 4 26B A4B advanced reasoning

Excellence en programmation

77.1% sur LiveCodeBench v6 avec appel de fonctions natif

Avec 77.1% sur LiveCodeBench v6 et 1718 Codeforces ELO, Gemma 4 26B A4B excelle en génération de code, débogage et workflows agentiques. L'appel de fonctions natif permet de créer des agents autonomes sans fine-tuning.

  • 77.1% sur les problèmes de programmation compétitive LiveCodeBench v6
  • 1718 Codeforces ELO rating
  • Appel de fonctions natif pour les agents autonomes
Gemma 4 26B A4B coding excellence

Compréhension multimodale

Traitement de texte et d'images avec résolution variable

Traitez le texte et les images ensemble avec la prise en charge de rapports d'aspect et de résolutions variables. 73.8% sur MMMU Pro et 82.4% sur MATH-Vision démontrent de solides capacités de raisonnement visuel et de compréhension de documents.

  • 73.8% sur MMMU Pro en raisonnement multimodal
  • 82.4% sur MATH-Vision en problèmes mathématiques visuels
  • Prise en charge de résolutions d'image variables (70-1120 tokens)
Gemma 4 26B A4B multimodal understanding

Télécharger les poids

Déploiement auto-hébergé

Téléchargez les poids officiels du modèle pour un déploiement sur votre infrastructure.

Déployer et mettre à l'échelle

Options de déploiement en production

Déploiement prêt pour l'entreprise sur Google Cloud, Kubernetes ou votre propre infrastructure.

Rejoignez le Gemmaverse

Partie intégrante de l'écosystème Gemma

Gemma 4 26B A4B fait partie de la famille de modèles ouverts de Google, avec un vaste soutien communautaire, des intégrations et des ressources.

Documentation

Guides complets pour l'intégration et le déploiement

Lire la documentation

Sécurité et responsabilité

Développement éthique de l'IA et directives de sécurité

En savoir plus

Fiche du modèle

Spécifications techniques et résultats d'évaluation

Voir les détails

Dépôt GitHub

Code source, exemples et contributions de la communauté

Voir le code

HuggingFace

Téléchargez les poids et explorez le hub de modèles

Télécharger

Déploiement Cloud

Déploiement entreprise sur Google Cloud

Déployer

Pour commencer

Prêt à construire avec Gemma 4 26B A4B ?

Commencez à discuter gratuitement dès maintenant, ou téléchargez le modèle pour un déploiement auto-hébergé sur votre infrastructure.