首页/💬 AI对话/Leaderboard by lmsys.org
Leaderboard by lmsys.org

Leaderboard by lmsys.org

LLM竞技场排行榜,基于真实用户投票的AI模型评测

访问官网

价格

付费 / 免费增值

产品介绍

Chatbot Arena Leaderboard是由LMSYS组织维护的大语言模型排行榜,通过真实用户的盲测投票评估AI模型性能。这是目前最权威、最客观的LLM评测平台之一,被AI社区广泛认可。

核心特点

  • 盲测评估:用户同时与两个匿名AI对话,选择更好的回答
  • Elo评分系统:类似国际象棋评分,动态更新模型排名
  • 真实场景:基于用户实际使用场景的问题和反馈
  • 多维度评测:编程、数学、推理、写作等分类排名
  • 持续更新:每天更新排名,新模型即时加入

意义和价值:相比传统基准测试,Chatbot Arena更接近真实使用场景。许多AI公司将Arena排名作为模型性能的重要指标。排行榜记录了AI模型的进化历程,见证了从GPT-4到Claude、Gemini、DeepSeek等模型的竞争。

适用场景:AI研究人员、开发者、用户可以通过排行榜了解最新最强的AI模型,帮助选择合适的模型使用或集成。

同类推荐