C-Eval-AI717 - 探索AI世界的导航站

C-Eval

网址：https://cevalbenchmark.com/static/leaderboard_zh.html

点击直达

C-Eval 是一个全面的中文基础模型评估套件。由上海交通大学、清华大学和爱丁堡大学研究人员在2023年5月份联合推出，它包含了13948个多项选择题，涵盖了52个不同的学科和四个难度级别，用以评测大模型中文理解能力。

FlagEval是智源研究院于2023年推出的大模型评测系统。...

是一个全面的中文基础模型评估套件。...

目前最流行的通用 LLM 评测榜单。...

MMLU，全称Massive Multitask Language Understanding...