最新资讯AI工具派快讯

大模型排名

分享 GitHub 上有趣和入门级的开源项目,找开源项目就上 HelloGitHub 开源社区

作者:HelloGitHub浏览:6,936发布日期:发布时间待补充喜欢:2,189
最新资讯6936 浏览2189 喜欢
大模型排名
2026 年 5 月大模型排行榜
编程语言用户贡献大模型数据库
rank_logo
LMArena
5月4月2月1月
排名模型分数
1claude-opus-4-7-thinking
1503
2claude-opus-4-6-thinking
1502
3claude-opus-4-6
1498
4gemini-3.1-pro
1492
5claude-opus-4-7
1491
6muse-spark
1490
7gemini-3-pro
1486
8gpt-5.5-high
1484
9grok-4.20-beta1
1480
10gpt-5.2-chat-latest
1477
11gpt-5.4-high
1477
12grok-4.20-beta-reasoning
1477
13gpt-5.5
1475
14ernie-5.1
1474
15grok-4.20-multi-agent-beta
1474
16gemini-3-flash
1474
17claude-opus-4-5-thinking-32k
1473
18gpt-5.5-instant
1473
19glm-5.1
1471
20claude-opus-4-5
1468
排名模型分数机构
1claude-opus-4-7-thinking
1503
Anthropic
2claude-opus-4-6-thinking
1502
Anthropic
3claude-opus-4-6
1498
Anthropic
4gemini-3.1-pro
1492
Google
5claude-opus-4-7
1491
Anthropic
6muse-spark
1490
Meta
7gemini-3-pro
1486
Google
8gpt-5.5-high
1484
OpenAI
9grok-4.20-beta1
1480
xAI
10gpt-5.2-chat-latest
1477
OpenAI
11gpt-5.4-high
1477
OpenAI
12grok-4.20-beta-reasoning
1477
xAI
13gpt-5.5
1475
OpenAI
14ernie-5.1
1474
Baidu
15grok-4.20-multi-agent-beta
1474
xAI
16gemini-3-flash
1474
Google
17claude-opus-4-5-thinking-32k
1473
Anthropic
18gpt-5.5-instant
1473
OpenAI
19glm-5.1
1471
Z.ai
20claude-opus-4-5
1468
Anthropic

「LMArena 排名」是基于众包用户投票的大语言模型排行榜。通过让用户与两个匿名模型对话并选择更好的回答,使用 Elo 评分系统计算模型的相对实力。该排行榜覆盖文本、视觉、代码等多个能力维度,是目前最权威的 LLM 评测榜单之一,基于此榜单我们做了模型名称聚合和清理工作。

推荐项目
换一换

文章来源: https://hellogithub.com/report/lm-rank

来源与声明

本站快讯内容主要用于行业资讯整理与信息聚合,部分内容来源于公开网络与第三方平台,仅供学习、参考与行业交流使用。

如相关内容涉及版权、署名或权益问题,请通过站点联系邮箱与我们联系,我们会在核实后尽快处理。

关联工具

文中相关方向,可以先从这些工具开始试

OpenCode | 开源 AI 编程代理 是一款围绕 代码生成与开发辅助、AI 对话问答 展开的 AI IDE 工具,公开页面更强调它在 代码开发与自动化工作流、办公文档、PPT、表格处理 这类任务里的实际用途。从页面信息来看,中文使用场景与中文内容支持会更清晰一些。

MetaGPT 可以先理解为一款面向 代码开发与自动化工作流 的 Agent与工作流 工具,当前公开信息主要围绕 代码生成与开发辅助、AI PPT 生成 这些能力展开。如果你主要在中文环境里工作,可优先确认中文输入、输出和界面是否符合预期。

CodeBuddy 可以先理解为一款面向 代码开发与自动化工作流 的 AI编程助手 工具,当前公开信息主要围绕 AI 对话问答、代码生成与开发辅助 这些能力展开。如果你主要在中文环境里工作,可优先确认中文输入、输出和界面是否符合预期。

Claude Dev 可以先理解为一款面向 代码开发与自动化工作流 的 Agent与工作流 工具,当前公开信息主要围绕 代码生成与开发辅助、AI 对话问答 这些能力展开。如果你主要在中文环境里工作,可优先确认中文输入、输出和界面是否符合预期。

FunAudioLLM 可以先理解为一款面向 代码开发与自动化工作流 的 语音与音频 工具,当前公开信息主要围绕 代码生成与开发辅助、AI 对话问答 这些能力展开。如果你主要在中文环境里工作,可优先确认中文输入、输出和界面是否符合预期。

CMMLU 可以先理解为一款面向 代码开发与自动化工作流、办公文档、PPT、表格处理 的 AI IDE 工具,当前公开信息主要围绕 代码生成与开发辅助、AI 对话问答 这些能力展开。如果你主要在中文环境里工作,可优先确认中文输入、输出和界面是否符合预期。

相关推荐

继续看同主题内容

文章评论

阅读后的真实反馈

支持继续回复展开讨论,审核通过后会展示在页面中。

访
写下你的看法当前身份:访客
0 条评论
全部评论0 条
暂时还没有评论,欢迎来留下第一条看法。