使命

本站发布简洁的静态基准测试摘要,让 AI 产品团队能够快速对比模型,无需费力浏览复杂的仪表板或论文。

每个基准测试页面包含可排序表格、指标说明和清晰的来源标注。

关于数据

基准数据来自公开来源,并在各基准页面中进行汇总。分数与表格反映更新时的来源版本。

当来源更新时,将在下一次更新周期中同步。

联系

如需咨询数据或网站相关问题,请在 GitHub 仓库中提交 Issue。