Gemma 4 26B A4B

26 milliards de paramètres, 4 milliards actifs - l'intelligence de pointe à la vitesse d'inférence

Gemma 4 26B A4B est un modèle Mixture-of-Experts qui n'active que 4B de paramètres par token tout en offrant une qualité proche du 31B. Avec un contexte de 256K, plus de 140 langues et 88.3% sur AIME 2026, c'est la voie la plus efficiente vers un raisonnement de classe mondiale.

Démarrer une conversation Voir les benchmarks

Variantes du modèle

Modèles instruction-tuned et de base

Choisissez entre la variante instruction-tuned optimisée pour le chat et l'exécution de tâches, ou le modèle de base pour le fine-tuning et les applications spécialisées.

Architecture Mixture-of-Experts

25.2B de paramètres totaux, 3.8B actifs par token

Gemma 4 26B A4B utilise une architecture MoE éparse avec 8 experts actifs sur 128 au total, plus 1 expert partagé. Les 26B de paramètres sont chargés en mémoire pour un routage rapide, mais le coût d'inférence reste proche d'un modèle dense de 4B.

Idéal pour les déploiements en production à haut débit nécessitant une qualité proche du 31B à une fraction du coût de calcul.

Démarrer une conversation Voir les capacités

Instruction-tuned

26B Instruct

Optimisé pour l'IA conversationnelle et l'exécution de tâches complexes

Affiné avec RLHF pour le suivi d'instructions et le dialogue multi-tours

Disponible maintenant

Démarrer une conversation Télécharger les poids

Pré-entraîné

26B Base

Modèle MoE de base pour le fine-tuning et les applications spécialisées

Pré-entraîné sur des données multimodales diversifiées avec routage d'experts épars

Disponible maintenant

Voir sur HuggingFace Guide de fine-tuning

Capacités

Performances de pointe au coût d'inférence de 4B

Gemma 4 26B A4B combine l'efficience MoE avec un raisonnement avancé, des capacités de programmation exceptionnelles et une compréhension multimodale - offrant une qualité proche du 31B à une fraction du coût de calcul.

Efficience MoE

N'active que 3.8B de paramètres par token sur un total de 25.2B. Une qualité proche du 31B au coût d'inférence d'environ 4B - le meilleur ratio d'efficience de la famille Gemma 4.

Raisonnement avancé

Le mode de réflexion configurable permet un raisonnement étape par étape. Atteint 88.3% sur AIME 2026 en mathématiques - à seulement 0.9 point du modèle dense 31B.

Excellence en programmation

77.1% sur LiveCodeBench v6 et 1718 Codeforces ELO. Appel de fonctions natif pour les workflows agentiques et l'exécution autonome de code.

Fenêtre de contexte de 256K

Contexte étendu pour les bases de code complètes, les documents longs et les conversations multi-tours. Attention hybride locale/globale pour une utilisation efficiente de la mémoire.

Compréhension multimodale

Traite le texte et les images avec des rapports d'aspect variables. 73.8% sur MMMU Pro et 82.4% sur MATH-Vision pour le raisonnement visuel.

Plus de 140 langues

Prise en charge multilingue avec compréhension du contexte culturel. 82.6% sur MMLU Pro dans divers domaines de connaissances.

Points clés

Des métriques de performance exceptionnelles

Gemma 4 26B A4B atteint des résultats proches du 31B sur divers benchmarks tout en n'activant que 3.8B de paramètres par token.

Résultats majeurs

Arena AI ELO 1441 - compétitif avec le modèle dense 31B
88.3% sur AIME 2026 en mathématiques (sans outils)
77.1% sur LiveCodeBench v6 en programmation
82.3% sur GPQA Diamond en connaissances scientifiques
85.5% sur t2-bench en utilisation d'outils agentiques

Spécifications techniques

25.2B de paramètres totaux, 3.8B actifs par token
8 experts actifs + 1 expert partagé sur 128 au total
Fenêtre de contexte de 256K tokens
Prise en charge de plus de 140 langues
Mécanisme d'attention hybride locale/globale

Démarrer gratuitement Télécharger les poids

Performances

Une qualité proche du 31B au coût d'inférence de 4B

Gemma 4 26B A4B atteint 88.3% sur AIME 2026 et 82.6% sur MMLU Pro - à moins de 1% du modèle dense 31B - tout en n'activant que 3.8B de paramètres par token.

Gemma 4 26B A4B démontre une excellence constante en raisonnement, programmation, multimodal et benchmarks agentiques - à 1-3% du modèle dense 31B sur chaque tâche.

Démarrer une conversation Voir la fiche du modèle

Graphique comparatif des performances de Gemma 4 26B A4B

Arena AI ELO 1441 - compétitif avec le modèle dense 31B

88.3% sur AIME 2026 en mathématiques (sans outils)

77.1% sur LiveCodeBench v6 en programmation compétitive

82.3% sur GPQA Diamond en connaissances scientifiques

85.5% sur t2-bench en utilisation d'outils agentiques

Comparaison des benchmarks

26B MoE vs 31B Dense et la famille Gemma 4

Gemma 4 26B A4B offre des performances proches du 31B en raisonnement, programmation, multimodal et tâches agentiques à une fraction du coût d'inférence.

Benchmark	Gemma 4 26B A4B IT Thinking En vedette	Gemma 4 31B IT Thinking	Gemma 4 E4B IT Thinking	Gemma 3 27B IT
Arena AI (text) Au 2 avril 2026	1441	1452	-	1365
MMLU Pro Connaissances et raisonnement Sans outils	82.6%	85.2%	69.4%	67.6%
MMMU Pro Raisonnement multimodal	73.8%	76.9%	52.6%	49.7%
AIME 2026 Mathématiques Sans outils	88.3%	89.2%	42.5%	20.8%
LiveCodeBench v6 Programmation compétitive	77.1%	80.0%	52.0%	29.1%
GPQA Diamond Connaissances scientifiques Sans outils	82.3%	84.3%	58.6%	42.4%
t2-bench Utilisation d'outils agentiques Retail	85.5%	86.4%	57.5%	6.6%

Résultats des benchmarks issus de la fiche officielle du modèle Gemma 4. Scores Arena AI au 2 avril 2026.

Architecture MoE

Capacité de 26B, coût d'inférence de 4B

L'architecture Mixture-of-Experts achemine chaque token à travers 8 des 128 experts, plus 1 expert partagé. Les 26B de paramètres restent en mémoire pour un routage instantané, mais seuls 3.8B s'activent par passe - offrant une qualité proche du 31B à une fraction du coût de calcul.

3.8B de paramètres actifs par token sur une capacité totale de 25.2B
8 experts actifs + 1 expert partagé sur 128 experts au total
p-RoPE proportionnel pour une gestion efficiente du contexte de 256K

Démarrer une conversation Voir les benchmarks

Raisonnement avancé

88.3% sur AIME 2026 - à moins de 1% du modèle 31B

Le mode de réflexion configurable permet un raisonnement transparent étape par étape pour les mathématiques, la logique et la résolution de problèmes en plusieurs étapes. Le MoE 26B réduit l'écart avec le modèle dense 31B à moins d'un point de pourcentage sur les benchmarks mathématiques les plus exigeants.

88.3% sur AIME 2026 en mathématiques (sans outils)
82.3% sur GPQA Diamond en sciences de niveau avancé
Mode de raisonnement intégré avec explications étape par étape

Essayer le raisonnement Voir les benchmarks

Excellence en programmation

77.1% sur LiveCodeBench v6 avec appel de fonctions natif

Avec 77.1% sur LiveCodeBench v6 et 1718 Codeforces ELO, Gemma 4 26B A4B excelle en génération de code, débogage et workflows agentiques. L'appel de fonctions natif permet de créer des agents autonomes sans fine-tuning.

77.1% sur les problèmes de programmation compétitive LiveCodeBench v6
1718 Codeforces ELO rating
Appel de fonctions natif pour les agents autonomes

Tester la programmation Documentation d'intégration

Compréhension multimodale

Traitement de texte et d'images avec résolution variable

Traitez le texte et les images ensemble avec la prise en charge de rapports d'aspect et de résolutions variables. 73.8% sur MMMU Pro et 82.4% sur MATH-Vision démontrent de solides capacités de raisonnement visuel et de compréhension de documents.