Gemma 4 26B A4B

260억 파라미터, 40억 활성화 - 추론 속도로 최첨단 지능을

Gemma 4 26B A4B는 토큰당 4B 파라미터만 활성화하면서 31B급 품질을 제공하는 Mixture-of-Experts 모델입니다. 256K 컨텍스트, 140개 이상의 언어 지원, AIME 2026에서 88.3% 달성으로, 최첨단 추론 능력에 도달하는 가장 효율적인 방법입니다.

모델 변형

인스트럭션 튜닝 모델과 베이스 모델

채팅과 작업 처리에 최적화된 인스트럭션 튜닝 모델, 또는 파인튜닝과 전문 애플리케이션을 위한 베이스 모델 중에서 선택하실 수 있습니다.

Mixture-of-Experts 아키텍처

총 파라미터 25.2B, 토큰당 3.8B 활성화

Gemma 4 26B A4B는 총 128개의 전문가 중 8개를 활성화하고 1개의 공유 전문가를 추가로 사용하는 스파스 MoE 설계를 채택했습니다. 전체 26B 파라미터가 메모리에 상주하여 빠른 라우팅을 지원하면서도, 추론 비용은 4B 밀집 모델 수준으로 유지됩니다.

31B급 품질을 극히 적은 연산 비용으로 구현하는, 고처리량 프로덕션 배포에 이상적입니다.

인스트럭션 튜닝

26B Instruct

대화형 AI와 복잡한 작업 처리에 최적화

RLHF를 통한 지시 수행 및 멀티턴 대화 파인튜닝 완료

지금 이용 가능

사전 학습

26B Base

파인튜닝 및 전문 애플리케이션을 위한 기반 MoE 모델

스파스 전문가 라우팅을 적용한 다양한 멀티모달 데이터로 사전 학습 완료

지금 이용 가능

기능

4B 추론 비용으로 최첨단 수준의 성능을

Gemma 4 26B A4B는 MoE 효율성과 고급 추론, 뛰어난 코딩, 멀티모달 이해를 결합하여 극히 적은 연산 비용으로 31B급 품질을 제공합니다.

MoE 효율성

25.2B 파라미터 풀에서 토큰당 3.8B만 활성화합니다. 약 4B의 추론 비용으로 31B급 품질을 달성하며, Gemma 4 패밀리 최고의 효율 비율을 자랑합니다.

고급 추론

설정 가능한 사고 모드로 단계별 추론이 가능합니다. AIME 2026 수학에서 88.3%를 달성하며, 31B 밀집 모델과의 차이는 단 0.9포인트입니다.

뛰어난 코딩

LiveCodeBench v6에서 77.1%, Codeforces ELO 1718을 달성했습니다. 네이티브 함수 호출로 에이전트 워크플로우와 자율 코드 실행을 지원합니다.

256K 컨텍스트 윈도우

전체 코드베이스, 긴 문서, 멀티턴 대화를 위한 확장 컨텍스트를 제공합니다. 하이브리드 로컬/글로벌 어텐션으로 메모리 효율성을 실현합니다.

멀티모달 이해

가변 종횡비로 텍스트와 이미지를 처리합니다. MMMU Pro에서 73.8%, MATH-Vision에서 82.4%의 시각 추론 성능을 달성했습니다.

140개 이상의 언어 지원

문화적 맥락을 이해하는 다국어 지원을 제공합니다. MMLU Pro에서 82.6%를 달성하며 다양한 지식 영역을 포괄합니다.

주요 하이라이트

뛰어난 성능 지표

Gemma 4 26B A4B는 토큰당 3.8B 파라미터만 활성화하면서 다양한 벤치마크에서 31B급 결과를 달성합니다.

주요 성과

  • Arena AI ELO 1441 - 31B 밀집 모델에 필적
  • AIME 2026 수학에서 88.3% (도구 미사용)
  • LiveCodeBench v6 코딩에서 77.1%
  • GPQA Diamond 과학 지식에서 82.3%
  • t2-bench 에이전트 도구 사용에서 85.5%

기술 사양

  • 총 파라미터 25.2B, 토큰당 3.8B 활성화
  • 128개 중 8개 활성 전문가 + 1개 공유 전문가
  • 256K 토큰 컨텍스트 윈도우
  • 140개 이상의 언어 지원
  • 하이브리드 로컬/글로벌 어텐션 메커니즘

성능

4B 추론 비용으로 31B급 품질을

Gemma 4 26B A4B는 AIME 2026에서 88.3%, MMLU Pro에서 82.6%를 달성했습니다. 31B 밀집 모델과의 차이는 1% 이내이며, 토큰당 3.8B 파라미터만 활성화합니다.

Gemma 4 26B A4B는 추론, 코딩, 멀티모달, 에이전트 벤치마크 전반에서 일관된 우수성을 보여주며, 모든 작업에서 31B 밀집 모델과의 차이가 1-3% 이내입니다.

Gemma 4 26B A4B 성능 비교 차트

Arena AI ELO 1441 - 31B 밀집 모델에 필적

AIME 2026 수학에서 88.3% (도구 미사용)

LiveCodeBench v6 경쟁 코딩에서 77.1%

GPQA Diamond 과학 지식에서 82.3%

t2-bench 에이전트 도구 사용에서 85.5%

벤치마크 비교

26B MoE vs 31B 밀집 모델과 Gemma 4 패밀리

Gemma 4 26B A4B는 추론, 코딩, 멀티모달, 에이전트 작업에서 극히 적은 추론 비용으로 31B급 성능을 제공합니다.

Benchmark
Gemma 4 26B A4B IT
Thinking
주목
Gemma 4 31B IT
Thinking
Gemma 4 E4B IT
Thinking
Gemma 3 27B IT
Arena AI (text)
2026년 4월 2일 기준
14411452-1365
MMLU Pro
지식 및 추론
도구 미사용
82.6%85.2%69.4%67.6%
MMMU Pro
멀티모달 추론
73.8%76.9%52.6%49.7%
AIME 2026
수학
도구 미사용
88.3%89.2%42.5%20.8%
LiveCodeBench v6
경쟁 코딩
77.1%80.0%52.0%29.1%
GPQA Diamond
과학 지식
도구 미사용
82.3%84.3%58.6%42.4%
t2-bench
에이전트 도구 사용
Retail
85.5%86.4%57.5%6.6%

벤치마크 결과는 Gemma 4 공식 모델 카드 기준입니다. Arena AI 점수는 2026년 4월 2일 기준입니다.

MoE 아키텍처

26B 용량, 4B 추론 비용

Mixture-of-Experts 설계는 각 토큰을 128개 전문가 중 8개와 1개의 공유 전문가를 통해 라우팅합니다. 전체 26B 파라미터가 메모리에 상주하여 즉시 라우팅되지만, 포워드 패스당 활성화되는 것은 3.8B뿐입니다. 극히 적은 연산 비용으로 31B급 품질을 제공합니다.

  • 총 용량 25.2B에서 토큰당 3.8B 활성 파라미터
  • 128개 중 8개 활성 전문가 + 1개 공유 전문가
  • Proportional RoPE (p-RoPE)로 효율적인 256K 컨텍스트 처리
Gemma 4 26B A4B MoE architecture

고급 추론

AIME 2026에서 88.3% - 31B 모델과 1% 이내 차이

설정 가능한 사고 모드로 수학, 논리, 다단계 문제 해결에서 투명한 단계별 추론이 가능합니다. 26B MoE는 가장 어려운 수학 벤치마크에서 31B 밀집 모델과의 격차를 1퍼센트포인트 미만으로 좁혔습니다.

  • AIME 2026 수학에서 88.3% (도구 미사용)
  • GPQA Diamond 대학원 수준 과학에서 82.3%
  • 단계별 설명이 포함된 추론 모드 내장
Gemma 4 26B A4B advanced reasoning

코딩 성능

LiveCodeBench v6에서 77.1%, 네이티브 함수 호출 지원

LiveCodeBench v6에서 77.1%, Codeforces ELO 1718을 달성한 Gemma 4 26B A4B는 코드 생성, 디버깅, 에이전트 워크플로우에 탁월합니다. 네이티브 함수 호출로 파인튜닝 없이 자율 에이전트를 구축할 수 있습니다.

  • LiveCodeBench v6 경쟁 코딩 문제에서 77.1%
  • Codeforces ELO 레이팅 1718
  • 자율 에이전트를 위한 네이티브 함수 호출
Gemma 4 26B A4B coding excellence

멀티모달 이해

가변 해상도로 텍스트와 이미지 처리

가변 종횡비와 해상도를 지원하여 텍스트와 이미지를 함께 처리합니다. MMMU Pro에서 73.8%, MATH-Vision에서 82.4%를 달성하며 뛰어난 시각 추론과 문서 이해 능력을 보여줍니다.

  • MMMU Pro 멀티모달 추론에서 73.8%
  • MATH-Vision 시각 수학 문제에서 82.4%
  • 가변 이미지 해상도 지원 (70-1120 토큰)
Gemma 4 26B A4B multimodal understanding

시작하기

Gemma 4 26B를 지금 바로 체험하세요

바로 채팅을 시작하거나, 자체 호스팅 배포를 위해 가중치를 다운로드하세요.

가중치 다운로드

자체 호스팅 배포

고객 인프라에 배포하기 위한 공식 모델 가중치를 다운로드하세요.

배포 및 확장

프로덕션 배포 옵션

Google Cloud, Kubernetes 또는 자체 인프라에서의 엔터프라이즈급 배포를 지원합니다.

Gemmaverse에 참여하세요

Gemma 생태계의 일원

Gemma 4 26B A4B는 Google의 오픈 모델 패밀리에 속하며, 풍부한 커뮤니티 지원, 통합 기능, 리소스를 갖추고 있습니다.

문서

통합 및 배포를 위한 완전한 가이드

문서 읽기

안전성 및 책임

윤리적 AI 개발 및 안전 가이드라인

자세히 보기

모델 카드

기술 사양 및 평가 결과

상세 보기

GitHub 저장소

소스 코드, 예제, 커뮤니티 기여

코드 보기

HuggingFace

가중치 다운로드 및 모델 허브 탐색

다운로드

클라우드 배포

Google Cloud에서의 엔터프라이즈 배포

배포하기

시작하기

Gemma 4 26B A4B로 구축을 시작하시겠습니까?

무료로 바로 채팅을 시작하거나, 자체 호스팅 배포를 위해 모델을 다운로드하세요.