FlagEval
分类:AI模型评测
标签: # AI
网址:https://flageval.baai.ac.cn/
SEO查询: 爱站网 站长工具
FlagEval(天秤)是由北京智源人工智能研究院推出的一个大模型评测平台,旨在为AI基础模型提供科学、公正、开放的评测基准和工具。该平台采用“能力-任务-指标”三维评测框架,细粒度刻画基础模型的认知能力边界,覆盖了自然语言处理(NLP)、计算机视觉(CV)、音频(Audio)和多模态(Multimodal)等多个领域,支持多种下游任务。
相关网站
2月9日讯 近日,一款名为Seedance2.0的AI视频生成模型再度刷屏海内外互联网。根据官方资料,Seedance2.0由字节跳动推出,可根据文本或图像创建电影级视频。它采用双分支扩散变...
☕ 吐槽:看个收益,至于看 5 秒广告吗?作为一个老基民,我最烦的就是每天打开支付宝或天天基金时,先要忍受 5 秒钟的开屏广告,然后在一堆“热门推荐”、“理财课”的红点里找自己的收益数据。对于追求效率...
基于Ollama和OpenClaw实现100%本地化部署AI助手的完整指南,涵盖环境准备、模型部署、多模型切换及Telegram对接,确保免费、断网可用、灵活扩展的特性。内容综合多篇实践文档,关键步骤...
做汇报最痛苦的从来不是“写内容”,而是那些脏活累活:找模板、调字体、对齐图标、把 Excel 截图塞进去……一晚上过去了,PPT 还是丑得让人心碎。今天推荐的 SlideBot (2.0),...
🤔 还在给 ElevenLabs 交“月供”?做视频、做播客的朋友都知道,ElevenLabs 效果是好,但那是真的贵。按字符收费,稍微改几个字,几美刀就没了。而且,要把自己的声音传到别人云端服务器,...
最近参加各个科技论坛、峰会,遇到不少同行,我发现大家都乐观了起来,因为,在这波科技股AI 浪潮中赚到钱了。都说三根大阳线改变信仰,这次AI 热潮的大阳线可不止三根。比起小打小闹的散户,科技大厂们在这波...
一夜之间,甲骨文就从垂垂老矣的数据库公司变成AI巨擘,以及成为未来TikTok 股权交易的最大赢家。美东时间9 月15 日,甲骨文股价再度上涨3.41%。此前八月,它就被美国私人金融和投资咨询公司Mo...
“Nano Banana的爆火,还只是一个开始。”谷歌的新一代AI绘图模型Nano Banana,一夜刷爆全网社交媒体。出道仅两周,Nano Banana就彻底改变了游戏规则——脚踢Flux,拳打GP...