常用LLM 榜单
LMArena
LMArena 是由加州大学伯克利分校团队创建的一个开放平台,用户可以方便地体验并对比各类主流大模型。平台通过让用户对模型回答进行投票,形成公开排行榜,让大模型能力的差异和进步更加直观、透明,也更贴近真实使用场景。作为一种群众驱动的评测机制,LMArena 已成为当前了解前沿大模型表现的重要参考平台之一。
网址:
https://lmarena.ai/leaderboard
司南
司南是中国国内由上海人工智能实验室发起的“大模型评测体系”,旨在为大语言模型、多模态模型等提供全栈、可复现、开放的评测工具、基准与榜单。
网址:
https://opencompass.org.cn/home
欢迎来撩 : 汇总all
