C-Eval
分类:AI模型评测
网址:https://cevalbenchmark.com/static/leaderboard_zh.html
SEO查询: 爱站网 站长工具
C-Eval 是一个全面的中文基础模型评估套件。由上海交通大学、清华大学和爱丁堡大学研究人员在2023年5月份联合推出,它包含了13948个多项选择题,涵盖了52个不同的学科和四个难度级别,用以评测大模型中文理解能力。
相关网站
FlagEval是智源研究院于2023年推出的大模型评测系统。...
是一个全面的中文基础模型评估套件。...
目前最流行的通用 LLM 评测榜单。...
MMLU,全称Massive Multitask Language Understanding...