Gemma 4 26B A4B

26 Milliarden Parameter, 4 Milliarden aktiv - Spitzenintelligenz bei Inferenzgeschwindigkeit

Gemma 4 26B A4B ist ein Mixture-of-Experts-Modell, das nur 4B Parameter pro Token aktiviert und dabei nahezu 31B-Qualität liefert. Mit 256K-Kontext, über 140 Sprachen und 88.3% beim AIME 2026 ist es der effizienteste Weg zu Spitzenleistung beim logischen Denken.

Modellvarianten

Instruction-Tuned- und Basismodelle

Wählen Sie zwischen der Instruction-Tuned-Variante, die für Chat und Aufgabenbearbeitung optimiert ist, oder dem Basismodell für Feinabstimmung und spezialisierte Anwendungen.

Mixture-of-Experts-Architektur

25.2B Gesamtparameter, 3.8B aktiv pro Token

Gemma 4 26B A4B nutzt ein spärliches MoE-Design mit 8 aktiven Experten aus insgesamt 128, plus 1 gemeinsam genutztem Experten. Alle 26B Parameter werden für schnelles Routing in den Speicher geladen, aber die Inferenzkosten bleiben auf dem Niveau eines dichten 4B-Modells.

Ideal für Produktivumgebungen mit hohem Durchsatz, die nahezu 31B-Qualität bei einem Bruchteil der Rechenkosten benötigen.

Instruction-Tuned

26B Instruct

Optimiert für konversationelle KI und komplexe Aufgabenbearbeitung

Mit RLHF feinabgestimmt für Instruktionsbefolgung und mehrstufige Dialoge

Jetzt verfügbar

Vortrainiert

26B Base

MoE-Basismodell für Feinabstimmung und spezialisierte Anwendungen

Auf vielfältigen multimodalen Daten mit spärlichem Experten-Routing vortrainiert

Jetzt verfügbar

Fähigkeiten

Spitzenleistung bei 4B Inferenzkosten

Gemma 4 26B A4B vereint MoE-Effizienz mit fortschrittlichem logischem Denken, herausragender Programmierung und multimodalem Verständnis - nahezu 31B-Qualität bei einem Bruchteil der Rechenleistung.

MoE-Effizienz

Aktiviert nur 3.8B Parameter pro Token aus einem Pool von 25.2B. Nahezu 31B-Qualität bei ~4B Inferenzkosten - das beste Effizienzverhältnis in der Gemma 4-Familie.

Fortschrittliches logisches Denken

Der konfigurierbare Denkmodus ermöglicht schrittweises Schlussfolgern. Erreicht 88.3% beim AIME 2026 Mathematik-Benchmark - nur 0.9 Punkte hinter dem dichten 31B-Modell.

Herausragende Programmierung

77.1% bei LiveCodeBench v6 und 1718 Codeforces ELO. Nativer Funktionsaufruf für agentische Workflows und autonome Codeausführung.

256K-Kontextfenster

Erweiterter Kontext für vollständige Codebasen, lange Dokumente und mehrstufige Konversationen. Hybrider lokaler/globaler Aufmerksamkeitsmechanismus für Speichereffizienz.

Multimodales Verständnis

Verarbeitet Text und Bilder mit variablen Seitenverhältnissen. 73.8% bei MMMU Pro und 82.4% bei MATH-Vision für visuelles Denken.

Über 140 Sprachen

Mehrsprachige Unterstützung mit kulturellem Kontextverständnis. 82.6% bei MMLU Pro über verschiedene Wissensdomänen hinweg.

Wichtige Highlights

Herausragende Leistungskennzahlen

Gemma 4 26B A4B erzielt nahezu 31B-Ergebnisse in verschiedenen Benchmarks und aktiviert dabei nur 3.8B Parameter pro Token.

Top-Ergebnisse

  • Arena AI ELO 1441 - konkurrenzfähig mit dem dichten 31B-Modell
  • 88.3% beim AIME 2026 Mathematik-Benchmark (ohne Werkzeuge)
  • 77.1% bei LiveCodeBench v6 Programmierung
  • 82.3% bei GPQA Diamond wissenschaftliches Wissen
  • 85.5% bei t2-bench agentische Werkzeugnutzung

Technische Spezifikationen

  • 25.2B Gesamtparameter, 3.8B aktiv pro Token
  • 8 aktive + 1 gemeinsamer Experte aus insgesamt 128
  • 256K Token-Kontextfenster
  • Unterstützung für über 140 Sprachen
  • Hybrider lokaler/globaler Aufmerksamkeitsmechanismus

Leistung

Nahezu 31B-Qualität bei 4B Inferenzkosten

Gemma 4 26B A4B erreicht 88.3% beim AIME 2026 und 82.6% bei MMLU Pro - innerhalb von 1% des dichten 31B-Modells - und aktiviert dabei nur 3.8B Parameter pro Token.

Gemma 4 26B A4B zeigt durchgehend hervorragende Ergebnisse bei Benchmarks für logisches Denken, Programmierung, multimodale und agentische Aufgaben - innerhalb von 1-3% des dichten 31B-Modells bei jeder Aufgabe.

Leistungsvergleichsdiagramm von Gemma 4 26B A4B

Arena AI ELO 1441 - konkurrenzfähig mit dem dichten 31B-Modell

88.3% beim AIME 2026 Mathematik-Benchmark (ohne Werkzeuge)

77.1% bei LiveCodeBench v6 kompetitive Programmierung

82.3% bei GPQA Diamond wissenschaftliches Wissen

85.5% bei t2-bench agentische Werkzeugnutzung

Benchmark-Vergleich

26B MoE vs. 31B Dense und die Gemma 4-Familie

Gemma 4 26B A4B liefert nahezu 31B-Leistung bei logischem Denken, Programmierung, multimodalen und agentischen Aufgaben bei einem Bruchteil der Inferenzkosten.

Benchmark
Gemma 4 26B A4B IT
Thinking
Empfohlen
Gemma 4 31B IT
Thinking
Gemma 4 E4B IT
Thinking
Gemma 3 27B IT
Arena AI (text)
Stand 2. April 2026
14411452-1365
MMLU Pro
Wissen & logisches Denken
Ohne Werkzeuge
82.6%85.2%69.4%67.6%
MMMU Pro
Multimodales Denken
73.8%76.9%52.6%49.7%
AIME 2026
Mathematik
Ohne Werkzeuge
88.3%89.2%42.5%20.8%
LiveCodeBench v6
Kompetitive Programmierung
77.1%80.0%52.0%29.1%
GPQA Diamond
Wissenschaftliches Wissen
Ohne Werkzeuge
82.3%84.3%58.6%42.4%
t2-bench
Agentische Werkzeugnutzung
Retail
85.5%86.4%57.5%6.6%

Benchmark-Ergebnisse aus der offiziellen Gemma 4 Modellkarte. Arena AI-Ergebnisse Stand 2. April 2026.

MoE-Architektur

26B Kapazität, 4B Inferenzkosten

Das Mixture-of-Experts-Design leitet jedes Token durch 8 von 128 Experten plus 1 gemeinsam genutzten Experten. Alle 26B Parameter bleiben für sofortiges Routing im Speicher, aber nur 3.8B werden pro Vorwärtsdurchlauf aktiviert - nahezu 31B-Qualität bei einem Bruchteil der Rechenleistung.

  • 3.8B aktive Parameter pro Token aus 25.2B Gesamtkapazität
  • 8 aktive + 1 gemeinsamer Experte aus insgesamt 128 Experten
  • Proportional RoPE (p-RoPE) für effiziente 256K-Kontextverarbeitung
Gemma 4 26B A4B MoE architecture

Fortschrittliches logisches Denken

88.3% beim AIME 2026 - innerhalb von 1% des 31B-Modells

Der konfigurierbare Denkmodus ermöglicht transparentes schrittweises Schlussfolgern für Mathematik, Logik und mehrstufige Problemlösungen. Das 26B MoE-Modell schließt die Lücke zum dichten 31B-Modell auf unter 1 Prozentpunkt bei den anspruchsvollsten Mathematik-Benchmarks.

  • 88.3% beim AIME 2026 Mathematik-Benchmark (ohne Werkzeuge)
  • 82.3% bei GPQA Diamond wissenschaftliches Wissen auf Graduiertenniveau
  • Integrierter Denkmodus mit schrittweisen Erklärungen
Gemma 4 26B A4B advanced reasoning

Programmier-Exzellenz

77.1% bei LiveCodeBench v6 mit nativem Funktionsaufruf

Mit 77.1% bei LiveCodeBench v6 und 1718 Codeforces ELO glänzt Gemma 4 26B A4B bei Codegenerierung, Debugging und agentischen Workflows. Nativer Funktionsaufruf ermöglicht autonome Agenten ohne Feinabstimmung.

  • 77.1% bei LiveCodeBench v6 kompetitiven Programmieraufgaben
  • 1718 Codeforces ELO-Bewertung
  • Nativer Funktionsaufruf für autonome Agenten
Gemma 4 26B A4B coding excellence

Multimodales Verständnis

Text- und Bildverarbeitung mit variabler Auflösung

Verarbeiten Sie Text und Bilder gemeinsam mit Unterstützung für variable Seitenverhältnisse und Auflösungen. 73.8% bei MMMU Pro und 82.4% bei MATH-Vision belegen starkes visuelles Denken und Dokumentenverständnis.

  • 73.8% bei MMMU Pro multimodalem Denken
  • 82.4% bei MATH-Vision visuellen Mathematikaufgaben
  • Variable Bildauflösungsunterstützung (70-1120 Token)
Gemma 4 26B A4B multimodal understanding

Gewichte herunterladen

Selbst gehostete Bereitstellung

Laden Sie die offiziellen Modellgewichte für die Bereitstellung auf Ihrer eigenen Infrastruktur herunter.

Bereitstellen und skalieren

Optionen für die Produktivbereitstellung

Unternehmenstaugliche Bereitstellung auf Google Cloud, Kubernetes oder Ihrer eigenen Infrastruktur.

Treten Sie dem Gemmaverse bei

Teil des umfassenden Gemma-Ökosystems

Gemma 4 26B A4B ist Teil von Googles offener Modellfamilie mit umfangreicher Community-Unterstützung, Integrationen und Ressourcen.

Dokumentation

Vollständige Anleitungen für Integration und Bereitstellung

Dokumentation lesen

Sicherheit & Verantwortung

Ethische KI-Entwicklung und Sicherheitsrichtlinien

Mehr erfahren

Modellkarte

Technische Spezifikationen und Evaluierungsergebnisse

Details ansehen

GitHub Repository

Quellcode, Beispiele und Community-Beiträge

Code ansehen

HuggingFace

Gewichte herunterladen und den Model Hub erkunden

Herunterladen

Cloud-Bereitstellung

Unternehmenstaugliche Bereitstellung auf Google Cloud

Bereitstellen

Erste Schritte

Bereit, mit Gemma 4 26B A4B zu entwickeln?

Starten Sie jetzt kostenlos einen Chat oder laden Sie das Modell für eine selbst gehostete Bereitstellung auf Ihrer Infrastruktur herunter.