Gemma 4 26B A4B
26 Milliarden Parameter, 4 Milliarden aktiv - Spitzenintelligenz bei Inferenzgeschwindigkeit
Gemma 4 26B A4B ist ein Mixture-of-Experts-Modell, das nur 4B Parameter pro Token aktiviert und dabei nahezu 31B-Qualität liefert. Mit 256K-Kontext, über 140 Sprachen und 88.3% beim AIME 2026 ist es der effizienteste Weg zu Spitzenleistung beim logischen Denken.
Modellvarianten
Instruction-Tuned- und Basismodelle
Wählen Sie zwischen der Instruction-Tuned-Variante, die für Chat und Aufgabenbearbeitung optimiert ist, oder dem Basismodell für Feinabstimmung und spezialisierte Anwendungen.
Mixture-of-Experts-Architektur
25.2B Gesamtparameter, 3.8B aktiv pro Token
Gemma 4 26B A4B nutzt ein spärliches MoE-Design mit 8 aktiven Experten aus insgesamt 128, plus 1 gemeinsam genutztem Experten. Alle 26B Parameter werden für schnelles Routing in den Speicher geladen, aber die Inferenzkosten bleiben auf dem Niveau eines dichten 4B-Modells.
Ideal für Produktivumgebungen mit hohem Durchsatz, die nahezu 31B-Qualität bei einem Bruchteil der Rechenkosten benötigen.
Instruction-Tuned
26B Instruct
Optimiert für konversationelle KI und komplexe Aufgabenbearbeitung
Mit RLHF feinabgestimmt für Instruktionsbefolgung und mehrstufige Dialoge
Vortrainiert
26B Base
MoE-Basismodell für Feinabstimmung und spezialisierte Anwendungen
Auf vielfältigen multimodalen Daten mit spärlichem Experten-Routing vortrainiert
Fähigkeiten
Spitzenleistung bei 4B Inferenzkosten
Gemma 4 26B A4B vereint MoE-Effizienz mit fortschrittlichem logischem Denken, herausragender Programmierung und multimodalem Verständnis - nahezu 31B-Qualität bei einem Bruchteil der Rechenleistung.
MoE-Effizienz
Aktiviert nur 3.8B Parameter pro Token aus einem Pool von 25.2B. Nahezu 31B-Qualität bei ~4B Inferenzkosten - das beste Effizienzverhältnis in der Gemma 4-Familie.
Fortschrittliches logisches Denken
Der konfigurierbare Denkmodus ermöglicht schrittweises Schlussfolgern. Erreicht 88.3% beim AIME 2026 Mathematik-Benchmark - nur 0.9 Punkte hinter dem dichten 31B-Modell.
Herausragende Programmierung
77.1% bei LiveCodeBench v6 und 1718 Codeforces ELO. Nativer Funktionsaufruf für agentische Workflows und autonome Codeausführung.
256K-Kontextfenster
Erweiterter Kontext für vollständige Codebasen, lange Dokumente und mehrstufige Konversationen. Hybrider lokaler/globaler Aufmerksamkeitsmechanismus für Speichereffizienz.
Multimodales Verständnis
Verarbeitet Text und Bilder mit variablen Seitenverhältnissen. 73.8% bei MMMU Pro und 82.4% bei MATH-Vision für visuelles Denken.
Über 140 Sprachen
Mehrsprachige Unterstützung mit kulturellem Kontextverständnis. 82.6% bei MMLU Pro über verschiedene Wissensdomänen hinweg.
Wichtige Highlights
Herausragende Leistungskennzahlen
Gemma 4 26B A4B erzielt nahezu 31B-Ergebnisse in verschiedenen Benchmarks und aktiviert dabei nur 3.8B Parameter pro Token.
Top-Ergebnisse
- Arena AI ELO 1441 - konkurrenzfähig mit dem dichten 31B-Modell
- 88.3% beim AIME 2026 Mathematik-Benchmark (ohne Werkzeuge)
- 77.1% bei LiveCodeBench v6 Programmierung
- 82.3% bei GPQA Diamond wissenschaftliches Wissen
- 85.5% bei t2-bench agentische Werkzeugnutzung
Technische Spezifikationen
- 25.2B Gesamtparameter, 3.8B aktiv pro Token
- 8 aktive + 1 gemeinsamer Experte aus insgesamt 128
- 256K Token-Kontextfenster
- Unterstützung für über 140 Sprachen
- Hybrider lokaler/globaler Aufmerksamkeitsmechanismus
Leistung
Nahezu 31B-Qualität bei 4B Inferenzkosten
Gemma 4 26B A4B erreicht 88.3% beim AIME 2026 und 82.6% bei MMLU Pro - innerhalb von 1% des dichten 31B-Modells - und aktiviert dabei nur 3.8B Parameter pro Token.
Gemma 4 26B A4B zeigt durchgehend hervorragende Ergebnisse bei Benchmarks für logisches Denken, Programmierung, multimodale und agentische Aufgaben - innerhalb von 1-3% des dichten 31B-Modells bei jeder Aufgabe.
Arena AI ELO 1441 - konkurrenzfähig mit dem dichten 31B-Modell
88.3% beim AIME 2026 Mathematik-Benchmark (ohne Werkzeuge)
77.1% bei LiveCodeBench v6 kompetitive Programmierung
82.3% bei GPQA Diamond wissenschaftliches Wissen
85.5% bei t2-bench agentische Werkzeugnutzung
Benchmark-Vergleich
26B MoE vs. 31B Dense und die Gemma 4-Familie
Gemma 4 26B A4B liefert nahezu 31B-Leistung bei logischem Denken, Programmierung, multimodalen und agentischen Aufgaben bei einem Bruchteil der Inferenzkosten.
| Benchmark | Gemma 4 26B A4B IT Thinking Empfohlen | Gemma 4 31B IT Thinking | Gemma 4 E4B IT Thinking | Gemma 3 27B IT |
|---|---|---|---|---|
Arena AI (text) Stand 2. April 2026 | 1441 | 1452 | - | 1365 |
MMLU Pro Wissen & logisches Denken Ohne Werkzeuge | 82.6% | 85.2% | 69.4% | 67.6% |
MMMU Pro Multimodales Denken | 73.8% | 76.9% | 52.6% | 49.7% |
AIME 2026 Mathematik Ohne Werkzeuge | 88.3% | 89.2% | 42.5% | 20.8% |
LiveCodeBench v6 Kompetitive Programmierung | 77.1% | 80.0% | 52.0% | 29.1% |
GPQA Diamond Wissenschaftliches Wissen Ohne Werkzeuge | 82.3% | 84.3% | 58.6% | 42.4% |
t2-bench Agentische Werkzeugnutzung Retail | 85.5% | 86.4% | 57.5% | 6.6% |
Benchmark-Ergebnisse aus der offiziellen Gemma 4 Modellkarte. Arena AI-Ergebnisse Stand 2. April 2026.
MoE-Architektur
26B Kapazität, 4B Inferenzkosten
Das Mixture-of-Experts-Design leitet jedes Token durch 8 von 128 Experten plus 1 gemeinsam genutzten Experten. Alle 26B Parameter bleiben für sofortiges Routing im Speicher, aber nur 3.8B werden pro Vorwärtsdurchlauf aktiviert - nahezu 31B-Qualität bei einem Bruchteil der Rechenleistung.
- 3.8B aktive Parameter pro Token aus 25.2B Gesamtkapazität
- 8 aktive + 1 gemeinsamer Experte aus insgesamt 128 Experten
- Proportional RoPE (p-RoPE) für effiziente 256K-Kontextverarbeitung
Fortschrittliches logisches Denken
88.3% beim AIME 2026 - innerhalb von 1% des 31B-Modells
Der konfigurierbare Denkmodus ermöglicht transparentes schrittweises Schlussfolgern für Mathematik, Logik und mehrstufige Problemlösungen. Das 26B MoE-Modell schließt die Lücke zum dichten 31B-Modell auf unter 1 Prozentpunkt bei den anspruchsvollsten Mathematik-Benchmarks.
- 88.3% beim AIME 2026 Mathematik-Benchmark (ohne Werkzeuge)
- 82.3% bei GPQA Diamond wissenschaftliches Wissen auf Graduiertenniveau
- Integrierter Denkmodus mit schrittweisen Erklärungen
Programmier-Exzellenz
77.1% bei LiveCodeBench v6 mit nativem Funktionsaufruf
Mit 77.1% bei LiveCodeBench v6 und 1718 Codeforces ELO glänzt Gemma 4 26B A4B bei Codegenerierung, Debugging und agentischen Workflows. Nativer Funktionsaufruf ermöglicht autonome Agenten ohne Feinabstimmung.
- 77.1% bei LiveCodeBench v6 kompetitiven Programmieraufgaben
- 1718 Codeforces ELO-Bewertung
- Nativer Funktionsaufruf für autonome Agenten
Multimodales Verständnis
Text- und Bildverarbeitung mit variabler Auflösung
Verarbeiten Sie Text und Bilder gemeinsam mit Unterstützung für variable Seitenverhältnisse und Auflösungen. 73.8% bei MMMU Pro und 82.4% bei MATH-Vision belegen starkes visuelles Denken und Dokumentenverständnis.
- 73.8% bei MMMU Pro multimodalem Denken
- 82.4% bei MATH-Vision visuellen Mathematikaufgaben
- Variable Bildauflösungsunterstützung (70-1120 Token)
Erste Schritte
Gemma 4 26B jetzt ausprobieren
Starten Sie sofort einen Chat oder laden Sie die Gewichte für eine selbst gehostete Bereitstellung herunter.
Gewichte herunterladen
Selbst gehostete Bereitstellung
Laden Sie die offiziellen Modellgewichte für die Bereitstellung auf Ihrer eigenen Infrastruktur herunter.
Bereitstellen und skalieren
Optionen für die Produktivbereitstellung
Unternehmenstaugliche Bereitstellung auf Google Cloud, Kubernetes oder Ihrer eigenen Infrastruktur.
Treten Sie dem Gemmaverse bei
Teil des umfassenden Gemma-Ökosystems
Gemma 4 26B A4B ist Teil von Googles offener Modellfamilie mit umfangreicher Community-Unterstützung, Integrationen und Ressourcen.
Erste Schritte
Bereit, mit Gemma 4 26B A4B zu entwickeln?
Starten Sie jetzt kostenlos einen Chat oder laden Sie das Modell für eine selbst gehostete Bereitstellung auf Ihrer Infrastruktur herunter.