次级导航
blog
更新日志
关于
收录投稿
二级菜单样式
获取主题
排行榜
收录投稿
AI工具集
AI法律助手
AI模型测评
AI提示指令
AI开发框架
AI对话工具
AI学习网站
AI写作工具
AI办公工具
AI表格数据处理
AI内容检测
AI编程工具
AI视频工具
AI训练模型
AI设计工具
AI音频工具
blog
更新日志
关于
收录投稿
二级菜单样式
获取主题
排行榜
收录投稿
AI工具集
AI法律助手
AI模型测评
AI提示指令
AI开发框架
AI对话工具
AI学习网站
AI写作工具
AI办公工具
AI表格数据处理
AI内容检测
AI编程工具
AI视频工具
AI训练模型
AI设计工具
AI音频工具
首页
•
AI模型测评
•
CMMLU
CMMLU
3周前发布
3
0
0
收藏
0
一个综合性的大模型中文评估基准
收录时间:
2025-04-01
打开网站
手机查看
AI模型测评
CMMLU
打开网站
一个综合性的大模型中文评估基准
数据统计
相关导航
H2O EvalGPT
H2O.ai推出的基于Elo评级方法的大模型评估系统
Open LLM Leaderboard
Hugging Face推出的开源大模型排行榜单
SuperCLUE
中文通用大模型综合性测评基准
LLMEval3
由复旦大学NLP实验室推出的大模型评测基准
OpenCompass
上海人工智能实验室推出的大模型开放评测体系
Chatbot Arena
以众包方式进行匿名随机对战的LLM基准平台
MMLU
大规模多任务语言理解基准
PubMedQA
生物医学研究问答数据集和模型得分排行榜
暂无评论
暂无评论...
标签云
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章
软件
书籍