首页 AI模型评测内容详情
FlagEval

FlagEval

分类:AI模型评测

标签: # AI

网址:https://flageval.baai.ac.cn/

SEO查询: 爱站网 站长工具

点击直达

‌FlagEval(天秤)‌是由北京智源人工智能研究院推出的一个大模型评测平台,旨在为AI基础模型提供科学、公正、开放的评测基准和工具。该平台采用“能力-任务-指标”三维评测框架,细粒度刻画基础模型的认知能力边界,覆盖了自然语言处理(NLP)、计算机视觉(CV)、音频(Audio)和多模态(Multimodal)等多个领域,支持多种下游任务‌。

image.png