快捷AI导航
首页素材AI绘图AI视频AI对话
+
  1. 当前位置:
  2. 首页
  3. AI 模型评测
  • MMLU
    MMLU
    大规模多任务语言理解基准
  • Open LLM Leaderboard
    Open LLM Leaderboard
    Hugging Face推出的开源大模型排行榜单
  • C-Eval
    C-Eval
    一个全面的中文基础模型评估套件
  • FlagEval
    FlagEval
    智源研究院推出的FlagEval(天秤)大模型评测平台
  • SuperCLUE
    SuperCLUE
    中文通用大模型综合性测评基准
  • OpenCompass
    OpenCompass
    上海人工智能实验室推出的大模型开放评测体系
  • CMMLU
    CMMLU
    一个综合性的大模型中文评估基准
  • MMBench
    MMBench
    全方位的多模态大模型能力评测体系
  • HELM
    HELM
    斯坦福大学推出的大模型评测体系
  • Chatbot Arena
    Chatbot Arena
    以众包方式进行匿名随机对战的LLM基准平台
  • LLMEval3
    LLMEval3
    由复旦大学NLP实验室推出的大模型评测基准
  • H2O EvalGPT
    H2O EvalGPT
    H2O.ai推出的基于Elo评级方法的大模型评估系统
  • PubMedQA
    PubMedQA
    生物医学研究问答数据集和模型得分排行榜

热门工具

  • Midjourney
    Midjourney
    Midjourney是一款AI绘画工具,通过文本描述生成高质量图像,支持多种风格和主题。
  • Stable Diffusion
    Stable Diffusion
    《Stable Diffusion》是一种生成模型,通过学习大量文本与图像的对应关系,能根据输入的文本描述生成相关的图像。
  • 讯飞星火认知大模型
    讯飞星火认知大模型
    讯飞星火认知大模型,是由科大讯飞推出的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务,提供语言理解、知识问答、逻辑推理、数学题解答、代码理解与编写等多种能力。
  • ChatGPT
    ChatGPT
    ChatGPT是一款强大的人工智能聊天机器人,能够理解复杂问题,生成流畅自然的回答,帮助用户解决问题,提升交流体验。
  • 豆包
    豆包
    豆包是你的AI 聊天智能对话问答助手,写作文案翻译情感陪伴编程全能工具。豆包为你答疑解惑,提供灵感,辅助创作,也可以和你畅聊任何你感兴趣的话题。

推荐速递

提高工作效率7个AI工具

提高工作效率7个AI工具

精选七款强大AI工具,助力快速完成任务,提升工作效能,实现高效办公,是职场人士的必备利器。

全球最大开源模型Grok

全球最大开源模型Grok

Grok,作为全球最大的开源模型,以其强大的处理能力和广泛的应用领域,引领着开源技术的新潮流,助力全球创新发展。

百度推出4款AI工具

百度推出4款AI工具

百度推出全新AI工具,集成先进的人工智能技术,提供高效、便捷的智能服务,助力用户解决各类问题,开启智能生活新篇章。

© 2025 Created by 快捷AI导航 , Contact Email: guren_d@hotmail.com