按用例划分的顶级LLMs


目前还没有适用于所有任务的超级通用模型
模型现在正针对特定用例进行优化
因此,根据不同需求使用不同模型可以获得更好的结果并提升工作效率
基于 Arena (人类投票) + LiveBench (清洁基准) 数据构建
> 通用聊天与推理
对话、问答、文本分析的顶级模型
- Claude Opus 4.6 思考
- Gemini 3.1 Pro 预览
> 编码
在代码生成、重构、调试、算法任务方面的前沿
- Claude Opus 4.6 思考
- GPT 5.4 High
> 视觉
在图表/表格分析、视觉描述方面的领军者
- Claude Opus 4.6
- Gemini 3 Pro
> 搜索/基于网页的任务
用于信息搜索、外部来源、基于网页答案的最佳LLMs
- Claude Opus 4.6 Search
- Gemini 3.1 Pro Grounding
> 开源/自托管
提供开源权重、可用于本地部署的强大模型
- GLM-5
- GLM-4.7AI
> 文本转图像
在根据文本描述生成图像方面表现最佳
- Gemini 3.1 Flash (Nano Banana 2)
- GPT Image 1.5
> 文本转视频
在从文本生成短视频方面表现出色的LLMs
- Veo 3
- Grock Imagine
GLM-1.73%
NANO-0.66%
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论