首页 AI模型评测内容详情
MMLU

MMLU

分类:AI模型评测

标签: # AI工具合集 # AI

网址:https://paperswithcode.com/sota/multi-task-language-understanding-on-mmlu

SEO查询: 爱站网 站长工具

点击直达
简介
MMLU,全称Massive Multitask Language Understanding(大规模多任务语言理解)是人工智能领域最有影响力的大模型测评基准之一。涵盖了基础数学、计算机科学、法律、历史等57项任务,用以测试大模型的世界知识和问题解决能力。