AI 模型对比
主流 AI 模型横向对比:能力评分、价格、上下文窗口与 Benchmark 排名
55
收录模型
30
开源模型
21
多模态
10
家厂商
Claude
系列对比Claude Opus 4.8
Anthropic
Anthropic 当前最强模型,复杂推理、长周期 Agentic 编码与高自主任务能力顶级,Intelligence Index 排名第一。
上下文窗口
1M
输入价格
$5 / 1M
输出价格
$25 / 1M
Claude Sonnet 4.6
Anthropic
速度与智能的最佳平衡款,1M 上下文,日常开发与 Agent 任务的性价比之选。
上下文窗口
1M
输入价格
$3 / 1M
输出价格
$15 / 1M
Claude Opus 4.7
Anthropic
Claude Opus 上一代旗舰,1M 上下文,复杂推理与 Agentic 编码能力强,仍是顶级选择。
上下文窗口
1M
输入价格
$5 / 1M
输出价格
$25 / 1M
Claude Opus 4.6
Anthropic
Claude Opus 4.6,1M 上下文,支持扩展思考,复杂任务表现稳定。
上下文窗口
1M
输入价格
$5 / 1M
输出价格
$25 / 1M
Claude Sonnet 4.5
Anthropic
Claude Sonnet 4.5,200K 上下文,速度与智能均衡,编码与 Agent 任务表现优异。
上下文窗口
200K
输入价格
$3 / 1M
输出价格
$15 / 1M
Claude 3.5 Sonnet
Anthropic
Anthropic 最强编程模型,SWE-bench 第一,代码质量和指令遵循能力顶级,Agent 任务表现优异
上下文窗口
200K
输入价格
$3 / 1M
输出价格
$15 / 1M
Claude Opus 4.5
Anthropic
Claude Opus 4.5,200K 上下文,高质量推理与编码,性价比相对更优。
上下文窗口
200K
输入价格
$5 / 1M
输出价格
$25 / 1M
Claude Haiku 4.5
Anthropic
Claude Haiku 4.5,最快的 Claude,近前沿智能、200K 上下文,适合高并发与低延迟场景。
上下文窗口
200K
输入价格
$1 / 1M
输出价格
$5 / 1M
Claude 3 Haiku
Anthropic
Anthropic 最快最便宜的模型,适合实时对话和高频 API 调用,成本极低
上下文窗口
200K
输入价格
$0.25 / 1M
输出价格
$1.25 / 1M
GPT / OpenAI
系列对比GPT-5.5
OpenAI
OpenAI 当前旗舰,Intelligence Index 排名第二(仅次于 Claude Opus 4.8),高/超高推理档位表现顶级。
上下文窗口
—
输入价格
—
输出价格
—
o3
OpenAI
OpenAI o 系列推理模型,深度思考后回答,数学/科学/代码复杂问题表现强。
上下文窗口
200K
输入价格
—
输出价格
—
o1-preview
OpenAI
OpenAI 推理专项模型,深度思考后回答,数学/科学/代码复杂问题表现最强,但速度慢
上下文窗口
128K
输入价格
$15 / 1M
输出价格
$60 / 1M
GPT-4o
OpenAI
OpenAI 旗舰多模态模型,视觉/语音/文字全能,响应速度快,生态最完善
上下文窗口
128K
输入价格
$5 / 1M
输出价格
$15 / 1M
GPT-4o mini
OpenAI
GPT-4o 轻量版,速度比 GPT-4o 快 3 倍,价格降低 95%,适合高并发 Agent 场景
上下文窗口
128K
输入价格
$0.15 / 1M
输出价格
$0.6 / 1M
Gemini
系列对比Gemini 3.1 Pro
Google 旗舰,超长上下文、原生多模态与工具调用,推理能力位列第一梯队。
上下文窗口
1M
输入价格
$2 / 1M
输出价格
$12 / 1M
Gemini 3.5 Flash
Gemini 快速款,速度与成本俱佳,适合高并发与实时场景。
上下文窗口
1M
输入价格
$1.5 / 1M
输出价格
$9 / 1M
Gemini 2.0 Flash
Google 最新 Agentic 模型,百万 Token 超长上下文,原生支持工具调用,价格极低
上下文窗口
1M
输入价格
$0.1 / 1M
输出价格
$0.4 / 1M
Gemini 1.5 Pro
Google 超长上下文专项模型,200 万 Token 窗口,可分析整部代码库或长视频
上下文窗口
2M
输入价格
$3.5 / 1M
输出价格
$10.5 / 1M
DeepSeek
系列对比DeepSeek-R1
DeepSeek
专为复杂推理设计,数学/逻辑/代码能力与 o1 相当,但完全开源,训练成本仅 3%
上下文窗口
64K
输入价格
$0.55 / 1M
输出价格
$2.19 / 1M
DeepSeek-V3
DeepSeek
国产旗舰模型,代码和数学能力媲美 Claude,价格仅为 OpenAI 的 5%,性价比之王
上下文窗口
64K
输入价格
$0.27 / 1M
输出价格
$1.1 / 1M
DeepSeek V4 Pro
DeepSeek
国产开源旗舰,1M 上下文、思考/非思考双模式,代码与推理强,价格仅为闭源旗舰的零头。
上下文窗口
1M
输入价格
$0.44 / 1M
输出价格
$0.87 / 1M
DeepSeek V4 Flash
DeepSeek
DeepSeek 快速开源款,1M 上下文,极低价格,适合大规模批处理。
上下文窗口
1M
输入价格
$0.14 / 1M
输出价格
$0.28 / 1M
Llama
系列对比Llama 4 Maverick
Meta
Meta Llama 4 Maverick:400B 总参(17B 激活,128 专家)MoE,1M 上下文,开放权重、商业友好。
上下文窗口
1M
输入价格
开源免费
输出价格
开源免费
Llama 3.3 70B
Meta
Meta 最新开源旗舰,700 亿参数,可自托管,商业友好 License,性能逼近闭源模型
上下文窗口
128K
输入价格
开源免费
输出价格
开源免费
Llama 3.1 405B
Meta
Meta Llama 3.1 405B:4050 亿参旗舰开源模型,128K 上下文,性能逼近闭源旗舰。
上下文窗口
128K
输入价格
开源免费
输出价格
开源免费
Llama 4 Scout
Meta
Meta 最新开源模型,原生 10M 超长上下文,可自托管、商业友好。
上下文窗口
10M
输入价格
开源免费
输出价格
开源免费
Llama 3.1 70B
Meta
Meta Llama 3.1 70B:700 亿参开源通用模型,128K 上下文,部署性价比高。
上下文窗口
128K
输入价格
开源免费
输出价格
开源免费
Llama 3.1 8B
Meta
Meta Llama 3.1 8B:80 亿参轻量开源模型,128K 上下文,适合端侧与低成本部署。
上下文窗口
128K
输入价格
开源免费
输出价格
开源免费
Qwen 通义千问
系列对比Qwen3-Max
Alibaba
通义千问 3 Max:超 1T 参数闭源旗舰,通义系列能力天花板。
上下文窗口
—
输入价格
—
输出价格
—
Qwen3-Coder
Alibaba
通义千问 3 代码专项:480B-A35B MoE 开源(Apache 2.0),代码能力强。
上下文窗口
—
输入价格
—
输出价格
—
Qwen2.5-Coder
Alibaba
阿里代码专项模型,代码能力超越 Claude 3.5 Sonnet,HumanEval 98.5%,完全开源
上下文窗口
128K
输入价格
开源免费
输出价格
开源免费
Qwen3.5
Alibaba
阿里通义千问 3.5,开源、速度快、价格极低(最低约 $0.01/1M),多尺寸可选。
上下文窗口
—
输入价格
$0.01 / 1M
输出价格
—
Qwen3.6-Plus
Alibaba
通义千问 3.6 Plus:闭源旗舰版,2026 年发布,综合能力对标主流闭源模型。
上下文窗口
—
输入价格
—
输出价格
—
Qwen3.6
Alibaba
通义千问 3.6:35B-A3B MoE 开源模型(Apache 2.0),2026 年最新一代。
上下文窗口
—
输入价格
—
输出价格
—
Qwen2.5-Max
Alibaba
通义千问 2.5 Max:大规模 MoE 旗舰,综合能力对标主流闭源模型。
上下文窗口
128K
输入价格
—
输出价格
—
Qwen2.5-72B
Alibaba
阿里巴巴通义千问最新旗舰,中文能力国内最强,完全开源,支持多模态
上下文窗口
128K
输入价格
开源免费
输出价格
开源免费
GLM 智谱
系列对比GLM-5
Zhipu
智谱 GLM-5:2026 年最新开源旗舰(MIT),综合能力对标主流闭源模型。
上下文窗口
—
输入价格
—
输出价格
—
GLM-4.7
Zhipu
智谱 GLM-4.7:开源(MIT),GLM-4.6 的迭代升级版。
上下文窗口
—
输入价格
—
输出价格
—
GLM-4.6
Zhipu
智谱 GLM-4.6:200K 上下文(较 4.5 的 128K 扩展),token 效率较上一代提升约 30%。
上下文窗口
200K
输入价格
—
输出价格
—
GLM-4.5
Zhipu
智谱 GLM-4.5:128K 上下文,综合能力对标主流模型,国产开源旗舰之一。
上下文窗口
128K
输入价格
—
输出价格
—
GLM-4-Plus
Zhipu
智谱 GLM-4-Plus:闭源旗舰版(2024),综合能力强。
上下文窗口
—
输入价格
—
输出价格
—
Kimi
系列对比Kimi K2 Thinking
Moonshot
Kimi K2 Thinking:256K 上下文、1T 参(32B 激活)MoE,专注深度推理,开源权重。
上下文窗口
256K
输入价格
—
输出价格
—
Kimi K2.6
Moonshot
Moonshot Kimi 系列,当前 Intelligence Index 排名最高的开源权重模型之一。
上下文窗口
—
输入价格
—
输出价格
—
Kimi K2.5
Moonshot
Moonshot Kimi K2.5:256K 上下文、1T 总参(32B 激活)MoE + 视觉,开源权重,K2 的多模态升级。
上下文窗口
256K
输入价格
—
输出价格
—
Kimi K2
Moonshot
Kimi K2:128K–256K 上下文、1T 总参(32B 激活)MoE,15.5T token 训练,开源权重。
上下文窗口
256K
输入价格
—
输出价格
—
Step 阶跃星辰
系列对比Step-3.7-Flash
StepFun
阶跃星辰 Step-3.7-Flash:2026 年最新开源(Apache 2.0)快速款。
上下文窗口
—
输入价格
—
输出价格
—
Step-3.5-Flash
StepFun
阶跃星辰 Step-3.5-Flash:196B-A11B MoE,256K 上下文,支持工具调用,开源(Apache 2.0)。
上下文窗口
256K
输入价格
—
输出价格
—
Step-3
StepFun
阶跃星辰 Step-3:2025 年发布的大模型,主打多模态与大规模参数。
上下文窗口
—
输入价格
—
输出价格
—
Step-2
StepFun
阶跃星辰 Step-2:万亿参数级 LLM(2024),国产大模型代表之一。
上下文窗口
—
输入价格
—
输出价格
—
Mistral
系列对比Mistral Large
Mistral
欧洲最强 AI 模型,多语言能力出色,支持 Function Calling,适合欧洲合规场景
上下文窗口
128K
输入价格
$2 / 1M
输出价格
$6 / 1M
Mistral Large 2
Mistral
Mistral 旗舰,128K 上下文,多语言与代码能力强,欧洲开放权重代表。
上下文窗口
128K
输入价格
—
输出价格
—
Mixtral 8x22B
Mistral
Mistral 旗舰 MoE 架构开源模型,1410 亿参数激活 390 亿,性能与成本的最佳平衡
上下文窗口
64K
输入价格
开源免费
输出价格
开源免费
Codestral
Mistral
Mistral 代码专项模型,支持 80+ 编程语言,代码补全与生成。
上下文窗口
32K
输入价格
—
输出价格
—
Mixtral 8x7B
Mistral
Mistral 经典 MoE 模型,8×7B 专家,开源、轻量高效,部署广泛。
上下文窗口
32K
输入价格
—
输出价格
—
其他模型
Benchmark 排行
价格说明
价格为参考值,实际以各厂商官网为准。部分模型提供免费额度或 API 试用。开源模型可自托管,仅需支付算力成本。