Gemma 4 26B A4B

260억 파라미터, 40억 활성화 - 추론 속도로 최첨단 지능을

Gemma 4 26B A4B는 토큰당 4B 파라미터만 활성화하면서 31B급 품질을 제공하는 Mixture-of-Experts 모델입니다. 256K 컨텍스트, 140개 이상의 언어 지원, AIME 2026에서 88.3% 달성으로, 최첨단 추론 능력에 도달하는 가장 효율적인 방법입니다.

채팅 시작하기 벤치마크 보기

모델 변형

인스트럭션 튜닝 모델과 베이스 모델

채팅과 작업 처리에 최적화된 인스트럭션 튜닝 모델, 또는 파인튜닝과 전문 애플리케이션을 위한 베이스 모델 중에서 선택하실 수 있습니다.

Mixture-of-Experts 아키텍처

총 파라미터 25.2B, 토큰당 3.8B 활성화

Gemma 4 26B A4B는 총 128개의 전문가 중 8개를 활성화하고 1개의 공유 전문가를 추가로 사용하는 스파스 MoE 설계를 채택했습니다. 전체 26B 파라미터가 메모리에 상주하여 빠른 라우팅을 지원하면서도, 추론 비용은 4B 밀집 모델 수준으로 유지됩니다.

31B급 품질을 극히 적은 연산 비용으로 구현하는, 고처리량 프로덕션 배포에 이상적입니다.

채팅 시작하기 기능 살펴보기

인스트럭션 튜닝

26B Instruct

대화형 AI와 복잡한 작업 처리에 최적화

RLHF를 통한 지시 수행 및 멀티턴 대화 파인튜닝 완료

지금 이용 가능

채팅 시작하기 가중치 다운로드

사전 학습

26B Base

파인튜닝 및 전문 애플리케이션을 위한 기반 MoE 모델

스파스 전문가 라우팅을 적용한 다양한 멀티모달 데이터로 사전 학습 완료

지금 이용 가능

HuggingFace에서 보기 파인튜닝 가이드

기능

4B 추론 비용으로 최첨단 수준의 성능을

Gemma 4 26B A4B는 MoE 효율성과 고급 추론, 뛰어난 코딩, 멀티모달 이해를 결합하여 극히 적은 연산 비용으로 31B급 품질을 제공합니다.

MoE 효율성

25.2B 파라미터 풀에서 토큰당 3.8B만 활성화합니다. 약 4B의 추론 비용으로 31B급 품질을 달성하며, Gemma 4 패밀리 최고의 효율 비율을 자랑합니다.

고급 추론

설정 가능한 사고 모드로 단계별 추론이 가능합니다. AIME 2026 수학에서 88.3%를 달성하며, 31B 밀집 모델과의 차이는 단 0.9포인트입니다.

뛰어난 코딩

LiveCodeBench v6에서 77.1%, Codeforces ELO 1718을 달성했습니다. 네이티브 함수 호출로 에이전트 워크플로우와 자율 코드 실행을 지원합니다.

256K 컨텍스트 윈도우

전체 코드베이스, 긴 문서, 멀티턴 대화를 위한 확장 컨텍스트를 제공합니다. 하이브리드 로컬/글로벌 어텐션으로 메모리 효율성을 실현합니다.

멀티모달 이해

가변 종횡비로 텍스트와 이미지를 처리합니다. MMMU Pro에서 73.8%, MATH-Vision에서 82.4%의 시각 추론 성능을 달성했습니다.

140개 이상의 언어 지원

문화적 맥락을 이해하는 다국어 지원을 제공합니다. MMLU Pro에서 82.6%를 달성하며 다양한 지식 영역을 포괄합니다.

주요 하이라이트

뛰어난 성능 지표

Gemma 4 26B A4B는 토큰당 3.8B 파라미터만 활성화하면서 다양한 벤치마크에서 31B급 결과를 달성합니다.

주요 성과

Arena AI ELO 1441 - 31B 밀집 모델에 필적
AIME 2026 수학에서 88.3% (도구 미사용)
LiveCodeBench v6 코딩에서 77.1%
GPQA Diamond 과학 지식에서 82.3%
t2-bench 에이전트 도구 사용에서 85.5%

기술 사양

총 파라미터 25.2B, 토큰당 3.8B 활성화
128개 중 8개 활성 전문가 + 1개 공유 전문가
256K 토큰 컨텍스트 윈도우
140개 이상의 언어 지원
하이브리드 로컬/글로벌 어텐션 메커니즘

무료 채팅 시작하기 가중치 다운로드

성능

4B 추론 비용으로 31B급 품질을

Gemma 4 26B A4B는 AIME 2026에서 88.3%, MMLU Pro에서 82.6%를 달성했습니다. 31B 밀집 모델과의 차이는 1% 이내이며, 토큰당 3.8B 파라미터만 활성화합니다.

Gemma 4 26B A4B는 추론, 코딩, 멀티모달, 에이전트 벤치마크 전반에서 일관된 우수성을 보여주며, 모든 작업에서 31B 밀집 모델과의 차이가 1-3% 이내입니다.

채팅 시작하기 모델 카드 보기

Arena AI ELO 1441 - 31B 밀집 모델에 필적

AIME 2026 수학에서 88.3% (도구 미사용)

LiveCodeBench v6 경쟁 코딩에서 77.1%

GPQA Diamond 과학 지식에서 82.3%

t2-bench 에이전트 도구 사용에서 85.5%

벤치마크 비교

26B MoE vs 31B 밀집 모델과 Gemma 4 패밀리

Gemma 4 26B A4B는 추론, 코딩, 멀티모달, 에이전트 작업에서 극히 적은 추론 비용으로 31B급 성능을 제공합니다.

Benchmark	Gemma 4 26B A4B IT Thinking 주목	Gemma 4 31B IT Thinking	Gemma 4 E4B IT Thinking	Gemma 3 27B IT
Arena AI (text) 2026년 4월 2일 기준	1441	1452	-	1365
MMLU Pro 지식 및 추론 도구 미사용	82.6%	85.2%	69.4%	67.6%
MMMU Pro 멀티모달 추론	73.8%	76.9%	52.6%	49.7%
AIME 2026 수학 도구 미사용	88.3%	89.2%	42.5%	20.8%
LiveCodeBench v6 경쟁 코딩	77.1%	80.0%	52.0%	29.1%
GPQA Diamond 과학 지식 도구 미사용	82.3%	84.3%	58.6%	42.4%
t2-bench 에이전트 도구 사용 Retail	85.5%	86.4%	57.5%	6.6%

벤치마크 결과는 Gemma 4 공식 모델 카드 기준입니다. Arena AI 점수는 2026년 4월 2일 기준입니다.

MoE 아키텍처

26B 용량, 4B 추론 비용

Mixture-of-Experts 설계는 각 토큰을 128개 전문가 중 8개와 1개의 공유 전문가를 통해 라우팅합니다. 전체 26B 파라미터가 메모리에 상주하여 즉시 라우팅되지만, 포워드 패스당 활성화되는 것은 3.8B뿐입니다. 극히 적은 연산 비용으로 31B급 품질을 제공합니다.