FlagEval是智源研究院于2023年推出的大模型评测系统。...
是一个全面的中文基础模型评估套件。...
目前最流行的通用 LLM 评测榜单。...
MMLU,全称Massive Multitask Language Understanding...