AI工具分类
AI办公工具
常用AI办公工具
AI幻灯片和演示
AI思维导图
AI文档工具
AI表格数据处理
AI会议工具
AI效率提升
AI图像工具
常用AI图像工具
AI图片插画生成
AI图片背景移除
AI图片物体抹除
AI商品图片生成
AI图片无损放大
AI图片优化修复
AI编程工具
AI写作工具
AI对话工具
AI开发平台
AI搜索引擎
AI翻译工具
AI视频工具
AI设计工具
AI音频工具
其他AI工具
AI学习网站
AI内容检测
AI训练模型
AI提示指令
AI模型评测
AI法律助手
AI新闻资讯
AI排行榜
投稿AI工具
Ctrl+D或⌘+D收藏本站⎡每周更新最新AI工具🎉⎦
AI办公工具
常用AI办公工具
AI幻灯片和演示
AI思维导图
AI文档工具
AI表格数据处理
AI会议工具
AI效率提升
AI图像工具
常用AI图像工具
AI图片插画生成
AI商品图片生成
AI图片优化修复
AI图片无损放大
AI图片背景移除
AI图片物体抹除
AI编程工具
AI写作工具
AI对话工具
AI开发平台
AI搜索引擎
AI翻译工具
AI视频工具
AI设计工具
AI音频工具
其他AI工具
AI学习网站
AI内容检测
AI训练模型
AI提示指令
AI模型评测
AI法律助手
AI模型评测
共 14 篇网址
AI模型评测
AI写作工具
AI图像工具
AI办公工具
AI设计工具
AI视频工具
AI音频工具
AI对话工具
AI搜索引擎
AI翻译工具
AI编程工具
AI开发平台
其他AI工具
热门AI工具
AI学习网站
AI内容检测
AI训练模型
AI模型评测
AI提示指令
AI法律助手
排序
发布
更新
浏览
点赞
收藏
MMLU
多任务语言理解基准测试,涵盖了 57 个不同的任务领域
10
0
AI模型评测
Open LLM Leaderboard
Hugging Face 推出的大语言模型的评估平台
17
0
AI模型评测
HELM
斯坦福大学开源的语言模型评测框架
12
0
AI模型评测
PubMedQA
评估 AI 模型在生物医学领域的阅读理解能力
13
0
AI模型评测
H2O EvalGPT
H2O.ai 开发的 GPT 模型评估工具
10
0
AI模型评测
OpenCompass
上海人工智能实验室推出的专注于对大型语言模型(LLM)的开源评测体系
12
0
AI模型评测
CMMLU
专注于中文语境的多任务评估框架
10
0
AI模型评测
Chatbot Arena
通过用户投票和对比测试,评估不同聊天机器人模型的开放平台
38
0
AI模型评测
LLMEval3
专注于评估大型语言模型(LLM)性能的开放平台
11
0
AI模型评测
FlagEval
北京人工智能研究院(BAAI)开发的开源评估平台
11
0
AI模型评测
C-Eval
专注于评估中文语言模型性能的基准测试平台
12
0
AI模型评测
SuperCLUE
专注于中文语言理解的基准测试平台
11
0
AI模型评测
AGI-Eval
专注于通用人工智能(AGI)能力评估的平台
11
0
AI模型评测
MMBench
MMBench 是一个专注于多模态基准测试的平台,旨在评估和...
18
0
AI模型评测
没有了
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章