Gemma 4 26B A4B

26 Milliarden Parameter, 4 Milliarden aktiv - Spitzenintelligenz bei Inferenzgeschwindigkeit

Gemma 4 26B A4B ist ein Mixture-of-Experts-Modell, das nur 4B Parameter pro Token aktiviert und dabei nahezu 31B-Qualität liefert. Mit 256K-Kontext, über 140 Sprachen und 88.3% beim AIME 2026 ist es der effizienteste Weg zu Spitzenleistung beim logischen Denken.

Chat starten Benchmarks ansehen

Modellvarianten

Instruction-Tuned- und Basismodelle

Wählen Sie zwischen der Instruction-Tuned-Variante, die für Chat und Aufgabenbearbeitung optimiert ist, oder dem Basismodell für Feinabstimmung und spezialisierte Anwendungen.

Mixture-of-Experts-Architektur

25.2B Gesamtparameter, 3.8B aktiv pro Token

Gemma 4 26B A4B nutzt ein spärliches MoE-Design mit 8 aktiven Experten aus insgesamt 128, plus 1 gemeinsam genutztem Experten. Alle 26B Parameter werden für schnelles Routing in den Speicher geladen, aber die Inferenzkosten bleiben auf dem Niveau eines dichten 4B-Modells.

Ideal für Produktivumgebungen mit hohem Durchsatz, die nahezu 31B-Qualität bei einem Bruchteil der Rechenkosten benötigen.

Chat starten Fähigkeiten ansehen

Instruction-Tuned

26B Instruct

Optimiert für konversationelle KI und komplexe Aufgabenbearbeitung

Mit RLHF feinabgestimmt für Instruktionsbefolgung und mehrstufige Dialoge

Jetzt verfügbar

Chat starten Gewichte herunterladen

Vortrainiert

26B Base

MoE-Basismodell für Feinabstimmung und spezialisierte Anwendungen

Auf vielfältigen multimodalen Daten mit spärlichem Experten-Routing vortrainiert

Jetzt verfügbar

Auf HuggingFace ansehen Anleitung zur Feinabstimmung

Fähigkeiten

Spitzenleistung bei 4B Inferenzkosten

Gemma 4 26B A4B vereint MoE-Effizienz mit fortschrittlichem logischem Denken, herausragender Programmierung und multimodalem Verständnis - nahezu 31B-Qualität bei einem Bruchteil der Rechenleistung.

MoE-Effizienz

Aktiviert nur 3.8B Parameter pro Token aus einem Pool von 25.2B. Nahezu 31B-Qualität bei ~4B Inferenzkosten - das beste Effizienzverhältnis in der Gemma 4-Familie.

Fortschrittliches logisches Denken

Der konfigurierbare Denkmodus ermöglicht schrittweises Schlussfolgern. Erreicht 88.3% beim AIME 2026 Mathematik-Benchmark - nur 0.9 Punkte hinter dem dichten 31B-Modell.

Herausragende Programmierung

77.1% bei LiveCodeBench v6 und 1718 Codeforces ELO. Nativer Funktionsaufruf für agentische Workflows und autonome Codeausführung.

256K-Kontextfenster

Erweiterter Kontext für vollständige Codebasen, lange Dokumente und mehrstufige Konversationen. Hybrider lokaler/globaler Aufmerksamkeitsmechanismus für Speichereffizienz.

Multimodales Verständnis

Verarbeitet Text und Bilder mit variablen Seitenverhältnissen. 73.8% bei MMMU Pro und 82.4% bei MATH-Vision für visuelles Denken.

Über 140 Sprachen

Mehrsprachige Unterstützung mit kulturellem Kontextverständnis. 82.6% bei MMLU Pro über verschiedene Wissensdomänen hinweg.

Wichtige Highlights

Herausragende Leistungskennzahlen

Gemma 4 26B A4B erzielt nahezu 31B-Ergebnisse in verschiedenen Benchmarks und aktiviert dabei nur 3.8B Parameter pro Token.

Top-Ergebnisse

Arena AI ELO 1441 - konkurrenzfähig mit dem dichten 31B-Modell
88.3% beim AIME 2026 Mathematik-Benchmark (ohne Werkzeuge)
77.1% bei LiveCodeBench v6 Programmierung
82.3% bei GPQA Diamond wissenschaftliches Wissen
85.5% bei t2-bench agentische Werkzeugnutzung

Technische Spezifikationen

25.2B Gesamtparameter, 3.8B aktiv pro Token
8 aktive + 1 gemeinsamer Experte aus insgesamt 128
256K Token-Kontextfenster
Unterstützung für über 140 Sprachen
Hybrider lokaler/globaler Aufmerksamkeitsmechanismus

Kostenlos chatten Gewichte herunterladen

Leistung

Nahezu 31B-Qualität bei 4B Inferenzkosten

Gemma 4 26B A4B erreicht 88.3% beim AIME 2026 und 82.6% bei MMLU Pro - innerhalb von 1% des dichten 31B-Modells - und aktiviert dabei nur 3.8B Parameter pro Token.

Gemma 4 26B A4B zeigt durchgehend hervorragende Ergebnisse bei Benchmarks für logisches Denken, Programmierung, multimodale und agentische Aufgaben - innerhalb von 1-3% des dichten 31B-Modells bei jeder Aufgabe.

Chat starten Modellkarte ansehen

Leistungsvergleichsdiagramm von Gemma 4 26B A4B

Arena AI ELO 1441 - konkurrenzfähig mit dem dichten 31B-Modell

88.3% beim AIME 2026 Mathematik-Benchmark (ohne Werkzeuge)

77.1% bei LiveCodeBench v6 kompetitive Programmierung

82.3% bei GPQA Diamond wissenschaftliches Wissen

85.5% bei t2-bench agentische Werkzeugnutzung

Benchmark-Vergleich

26B MoE vs. 31B Dense und die Gemma 4-Familie

Gemma 4 26B A4B liefert nahezu 31B-Leistung bei logischem Denken, Programmierung, multimodalen und agentischen Aufgaben bei einem Bruchteil der Inferenzkosten.

Benchmark	Gemma 4 26B A4B IT Thinking Empfohlen	Gemma 4 31B IT Thinking	Gemma 4 E4B IT Thinking	Gemma 3 27B IT
Arena AI (text) Stand 2. April 2026	1441	1452	-	1365
MMLU Pro Wissen & logisches Denken Ohne Werkzeuge	82.6%	85.2%	69.4%	67.6%
MMMU Pro Multimodales Denken	73.8%	76.9%	52.6%	49.7%
AIME 2026 Mathematik Ohne Werkzeuge	88.3%	89.2%	42.5%	20.8%
LiveCodeBench v6 Kompetitive Programmierung	77.1%	80.0%	52.0%	29.1%
GPQA Diamond Wissenschaftliches Wissen Ohne Werkzeuge	82.3%	84.3%	58.6%	42.4%
t2-bench Agentische Werkzeugnutzung Retail	85.5%	86.4%	57.5%	6.6%

Benchmark-Ergebnisse aus der offiziellen Gemma 4 Modellkarte. Arena AI-Ergebnisse Stand 2. April 2026.

MoE-Architektur

26B Kapazität, 4B Inferenzkosten

Das Mixture-of-Experts-Design leitet jedes Token durch 8 von 128 Experten plus 1 gemeinsam genutzten Experten. Alle 26B Parameter bleiben für sofortiges Routing im Speicher, aber nur 3.8B werden pro Vorwärtsdurchlauf aktiviert - nahezu 31B-Qualität bei einem Bruchteil der Rechenleistung.

3.8B aktive Parameter pro Token aus 25.2B Gesamtkapazität
8 aktive + 1 gemeinsamer Experte aus insgesamt 128 Experten
Proportional RoPE (p-RoPE) für effiziente 256K-Kontextverarbeitung

Chat starten Benchmarks ansehen

Fortschrittliches logisches Denken

88.3% beim AIME 2026 - innerhalb von 1% des 31B-Modells

Der konfigurierbare Denkmodus ermöglicht transparentes schrittweises Schlussfolgern für Mathematik, Logik und mehrstufige Problemlösungen. Das 26B MoE-Modell schließt die Lücke zum dichten 31B-Modell auf unter 1 Prozentpunkt bei den anspruchsvollsten Mathematik-Benchmarks.

88.3% beim AIME 2026 Mathematik-Benchmark (ohne Werkzeuge)
82.3% bei GPQA Diamond wissenschaftliches Wissen auf Graduiertenniveau
Integrierter Denkmodus mit schrittweisen Erklärungen

Denkaufgaben ausprobieren Benchmarks ansehen

Programmier-Exzellenz

77.1% bei LiveCodeBench v6 mit nativem Funktionsaufruf

Mit 77.1% bei LiveCodeBench v6 und 1718 Codeforces ELO glänzt Gemma 4 26B A4B bei Codegenerierung, Debugging und agentischen Workflows. Nativer Funktionsaufruf ermöglicht autonome Agenten ohne Feinabstimmung.

77.1% bei LiveCodeBench v6 kompetitiven Programmieraufgaben
1718 Codeforces ELO-Bewertung
Nativer Funktionsaufruf für autonome Agenten

Programmieraufgaben testen Integrationsdokumentation

Multimodales Verständnis

Text- und Bildverarbeitung mit variabler Auflösung

Verarbeiten Sie Text und Bilder gemeinsam mit Unterstützung für variable Seitenverhältnisse und Auflösungen. 73.8% bei MMMU Pro und 82.4% bei MATH-Vision belegen starkes visuelles Denken und Dokumentenverständnis.