← 용어

MMLU

Massive Multitask Language Understanding — 미국사부터 대학 수학까지 57개 과목. LLM 일반 지식 표준 벤치마크. 상위 오픈 모델 84~89, Claude Opus 4.7은 ~92. MMLU 높음은 좋은 챗 모델의 필요조건이지 충분조건은 아님.

관련 모델