首页/🤖 AI大模型/Open LLM Leaderboard by Hugging Face

Open LLM Leaderboard by Hugging Face

Open LLM Leaderboard by Hugging Face

Hugging Face的开源模型排行榜，评测开源AI性能

分类

🤖 AI大模型

价格

付费 / 免费增值

官网

产品介绍

Open LLM Leaderboard是Hugging Face维护的开源大语言模型排行榜，专注于评测和比较开源AI模型的性能。该平台使用多个标准化基准测试，为开源AI社区提供客观的性能参考。

核心特点：

开源专注：只评测完全开源的模型
标准化测试：使用MMLU、TruthfulQA等权威基准
透明公开：所有评测方法和结果完全公开
社区驱动：任何人都可以提交模型参与评测
详细指标：提供推理、知识、数学等细分能力评分

意义和价值：Open LLM Leaderboard见证了开源AI的快速发展，从Llama、Mistral到Qwen、DeepSeek等模型的进步。帮助开发者选择高质量的开源模型，推动开源AI生态繁荣。

适用场景：需要本地部署AI模型的开发者、AI研究人员、开源爱好者参考选型。

同类推荐

AI新闻动态

AI领域最新动态和技术资讯集合

💬通用对话

《GPT-4 ，通用人工智能的火花》论文内容精选与翻译

《GPT-4 ，通用人工智能的火花》论文内容精选与翻译

微软研究院GPT-4早期评测论文的中文精选翻译

💬通用对话

Leaderboard by lmsys.org

Leaderboard by lmsys.org

LLM竞技场排行榜，基于真实用户投票的AI模型评测

💬通用对话

Evals by MosaicML

MosaicML的AI模型评测工具，开源评测框架

💬通用对话

Holistic Evaluation of Language Models (HELM)

Holistic Evaluation of Language Models (HELM)

斯坦福HELM评测体系，全面评估语言模型多维度能力

💬通用对话

LLM-Leaderboard

AI模型排行榜，综合比较各类大语言模型

💬通用对话

TextSynth Server Benchmarks

TextSynth Server Benchmarks

AI模型推理性能基准测试，评估服务器效率

💬通用对话

Apache 2.0

Apache 2.0

Allows users to use the software for any

💬通用对话