FlagEval
分类:AI模型评测
标签: # AI
网址:https://flageval.baai.ac.cn/
SEO查询: 爱站网 站长工具
FlagEval(天秤)是由北京智源人工智能研究院推出的一个大模型评测平台,旨在为AI基础模型提供科学、公正、开放的评测基准和工具。该平台采用“能力-任务-指标”三维评测框架,细粒度刻画基础模型的认知能力边界,覆盖了自然语言处理(NLP)、计算机视觉(CV)、音频(Audio)和多模态(Multimodal)等多个领域,支持多种下游任务。
相关网站
近日消息,字节跳动正在整合AI研发团队,其内部组织架构再生变动,字节AI Lab即将全部收归Seed团队之下。在Seed团队成立之前,字节AI Lab曾是字节主要的AI研发部门。它成立于2016年,最...
近日,国民汉语教育工具、汉字规范宝典“新华字典”鸿蒙版正式上线。新华字典App鸿蒙版结合了HarmonyOS 5的互联、智能和精致特性,在语音检索、多端流转、定制化学习和界面交互等方面实现了显著进步。...
4月16日消息,QuestMobile数据表明,截至2025年2月,AI原生App的活跃用户数量达到了2.4亿。这主要得益于年初AI领域迎来标志性事件,DeepSeek-R1模型迅速引爆全球。短短一个...
据外媒报道,AI巨头OpenAI正在开发自己的社交媒体平台,形式类似马斯克旗下的X平台(前身为Twitter)。上述项目前仍处于早期阶段,相关消息比较少。据外媒,OpenAI正在开发一个 “内部原型”...
据媒体报道,在美国总统特朗普加征新关税后,中国的一款跨境电商App DHgate(敦煌网)在美国火了,下载量大增。 美区App Store显示,DHgate已位居免费应用排行榜的第二位,仅次...
据外媒报道,OpenAI正准备发布一系列全新模型。其中,包括一款预计被命名为GPT-4.1新模型,据称是GPT-4o多模态模型的改进版,最快将在下周面世。还会发布尺寸更小的GPT-4.1 mini和n...
连宫崎骏在AI面前都不堪一击了吗?最近,一股“晒出你的吉卜力画像”风席卷社交媒体。只因OpenAI将新版Sora整合进了GPT-4o,让用户能用一张照片生成动漫画像,画风可媲美宫崎骏的吉卜力工作室,瞬...
3月5日消息,生成式人工智能技术的迭代突破,正在推动AI应用向多领域纵深拓展,比如深度伪造、自动驾驶、AI医疗诊断等。这些AI技术在为人们带来新奇体验、便利应用的同时,也可能会导致新的社会问题。今年全...