AI 模型对比

Claude Opus 4.8

Anthropic

Anthropic 当前最强模型，复杂推理、长周期 Agentic 编码与高自主任务能力顶级，Intelligence Index 排名第一。

上下文窗口

输入价格

$5 / 1M

输出价格

$25 / 1M

Claude Sonnet 4.6

Anthropic

速度与智能的最佳平衡款，1M 上下文，日常开发与 Agent 任务的性价比之选。

上下文窗口

输入价格

$3 / 1M

输出价格

$15 / 1M

Claude Opus 4.7

Anthropic

Claude Opus 上一代旗舰，1M 上下文，复杂推理与 Agentic 编码能力强，仍是顶级选择。

上下文窗口

输入价格

$5 / 1M

输出价格

$25 / 1M

Claude Opus 4.6

Anthropic

Claude Opus 4.6，1M 上下文，支持扩展思考，复杂任务表现稳定。

上下文窗口

输入价格

$5 / 1M

输出价格

$25 / 1M

Claude Sonnet 4.5

Anthropic

Claude Sonnet 4.5，200K 上下文，速度与智能均衡，编码与 Agent 任务表现优异。

上下文窗口

200K

输入价格

$3 / 1M

输出价格

$15 / 1M

Claude 3.5 Sonnet

Anthropic

Anthropic 最强编程模型，SWE-bench 第一，代码质量和指令遵循能力顶级，Agent 任务表现优异

上下文窗口

200K

输入价格

$3 / 1M

输出价格

$15 / 1M

Claude Opus 4.5

Anthropic

Claude Opus 4.5，200K 上下文，高质量推理与编码，性价比相对更优。

上下文窗口

200K

输入价格

$5 / 1M

输出价格

$25 / 1M

Claude Haiku 4.5

Anthropic

Claude Haiku 4.5，最快的 Claude，近前沿智能、200K 上下文，适合高并发与低延迟场景。

上下文窗口

200K

输入价格

$1 / 1M

输出价格

$5 / 1M

Claude 3 Haiku

Anthropic

Anthropic 最快最便宜的模型，适合实时对话和高频 API 调用，成本极低

上下文窗口

200K

输入价格

$0.25 / 1M

输出价格

$1.25 / 1M

GPT / OpenAI

GPT-5.5

OpenAI

OpenAI 当前旗舰，Intelligence Index 排名第二（仅次于 Claude Opus 4.8），高/超高推理档位表现顶级。

上下文窗口

—

输入价格

—

输出价格

—

o3

OpenAI

OpenAI o 系列推理模型，深度思考后回答，数学/科学/代码复杂问题表现强。

上下文窗口

200K

输入价格

—

输出价格

—

o1-preview

OpenAI

OpenAI 推理专项模型，深度思考后回答，数学/科学/代码复杂问题表现最强，但速度慢

上下文窗口

128K

输入价格

$15 / 1M

输出价格

$60 / 1M

GPT-4o

OpenAI

OpenAI 旗舰多模态模型，视觉/语音/文字全能，响应速度快，生态最完善

上下文窗口

128K

输入价格

$5 / 1M

输出价格

$15 / 1M

GPT-4o mini

OpenAI

GPT-4o 轻量版，速度比 GPT-4o 快 3 倍，价格降低 95%，适合高并发 Agent 场景

上下文窗口

128K

输入价格

$0.15 / 1M

输出价格

$0.6 / 1M

Gemini

Gemini 3.1 Pro

Google

Google 旗舰，超长上下文、原生多模态与工具调用，推理能力位列第一梯队。

上下文窗口

输入价格

$2 / 1M

输出价格

$12 / 1M

Gemini 3.5 Flash

Google

Gemini 快速款，速度与成本俱佳，适合高并发与实时场景。

上下文窗口

输入价格

$1.5 / 1M

输出价格

$9 / 1M

Gemini 2.0 Flash

Google

Google 最新 Agentic 模型，百万 Token 超长上下文，原生支持工具调用，价格极低

上下文窗口

输入价格

$0.1 / 1M

输出价格

$0.4 / 1M

Gemini 1.5 Pro

Google

Google 超长上下文专项模型，200 万 Token 窗口，可分析整部代码库或长视频

上下文窗口

输入价格

$3.5 / 1M

输出价格

$10.5 / 1M

DeepSeek

DeepSeek-R1

DeepSeek

专为复杂推理设计，数学/逻辑/代码能力与 o1 相当，但完全开源，训练成本仅 3%

上下文窗口

64K

输入价格

$0.55 / 1M

输出价格

$2.19 / 1M

DeepSeek-V3

DeepSeek

国产旗舰模型，代码和数学能力媲美 Claude，价格仅为 OpenAI 的 5%，性价比之王

上下文窗口

64K

输入价格

$0.27 / 1M

输出价格

$1.1 / 1M

DeepSeek V4 Pro

DeepSeek

国产开源旗舰，1M 上下文、思考/非思考双模式，代码与推理强，价格仅为闭源旗舰的零头。

上下文窗口

输入价格

$0.44 / 1M

输出价格

$0.87 / 1M

DeepSeek V4 Flash

DeepSeek

DeepSeek 快速开源款，1M 上下文，极低价格，适合大规模批处理。

上下文窗口

输入价格

$0.14 / 1M

输出价格

$0.28 / 1M

Llama

Llama 4 Maverick

Meta

Meta Llama 4 Maverick：400B 总参（17B 激活，128 专家）MoE，1M 上下文，开放权重、商业友好。

上下文窗口

输入价格

开源免费

输出价格

开源免费

Llama 3.3 70B

Meta

Meta 最新开源旗舰，700 亿参数，可自托管，商业友好 License，性能逼近闭源模型

上下文窗口

128K

输入价格

开源免费

输出价格

开源免费

Llama 3.1 405B

Meta

Meta Llama 3.1 405B：4050 亿参旗舰开源模型，128K 上下文，性能逼近闭源旗舰。

上下文窗口

128K

输入价格

开源免费

输出价格

开源免费

Llama 4 Scout

Meta

Meta 最新开源模型，原生 10M 超长上下文，可自托管、商业友好。

上下文窗口

10M

输入价格

开源免费

输出价格

开源免费

Llama 3.1 70B

Meta

Meta Llama 3.1 70B：700 亿参开源通用模型，128K 上下文，部署性价比高。

上下文窗口

128K

输入价格

开源免费

输出价格

开源免费

Llama 3.1 8B

Meta

Meta Llama 3.1 8B：80 亿参轻量开源模型，128K 上下文，适合端侧与低成本部署。

上下文窗口

128K

输入价格

开源免费

输出价格

开源免费

Qwen 通义千问

Qwen3-Max

Alibaba

通义千问 3 Max：超 1T 参数闭源旗舰，通义系列能力天花板。

上下文窗口

—

输入价格

—

输出价格

—

Qwen3-Coder

Alibaba

通义千问 3 代码专项：480B-A35B MoE 开源（Apache 2.0），代码能力强。

上下文窗口

—

输入价格

—

输出价格

—

Qwen2.5-Coder

Alibaba

阿里代码专项模型，代码能力超越 Claude 3.5 Sonnet，HumanEval 98.5%，完全开源

上下文窗口

128K

输入价格

开源免费

输出价格

开源免费

Qwen3.5

Alibaba

阿里通义千问 3.5，开源、速度快、价格极低（最低约 $0.01/1M），多尺寸可选。

上下文窗口

—

输入价格

$0.01 / 1M

输出价格

—

Qwen3.6-Plus

Alibaba

通义千问 3.6 Plus：闭源旗舰版，2026 年发布，综合能力对标主流闭源模型。

上下文窗口

—

输入价格

—

输出价格

—

Qwen3.6

Alibaba

通义千问 3.6：35B-A3B MoE 开源模型（Apache 2.0），2026 年最新一代。

上下文窗口

—

输入价格

—

输出价格

—

Qwen2.5-Max

Alibaba

通义千问 2.5 Max：大规模 MoE 旗舰，综合能力对标主流闭源模型。

上下文窗口

128K

输入价格

—

输出价格

—

Qwen2.5-72B

Alibaba

阿里巴巴通义千问最新旗舰，中文能力国内最强，完全开源，支持多模态

上下文窗口

128K

输入价格

开源免费

输出价格

开源免费

GLM 智谱

GLM-5

Zhipu

智谱 GLM-5：2026 年最新开源旗舰（MIT），综合能力对标主流闭源模型。

上下文窗口

—

输入价格

—

输出价格

—

GLM-4.7

Zhipu

智谱 GLM-4.7：开源（MIT），GLM-4.6 的迭代升级版。

上下文窗口

—

输入价格

—

输出价格

—

GLM-4.6

Zhipu

智谱 GLM-4.6：200K 上下文（较 4.5 的 128K 扩展），token 效率较上一代提升约 30%。

上下文窗口

200K

输入价格

—

输出价格

—

GLM-4.5

Zhipu

智谱 GLM-4.5：128K 上下文，综合能力对标主流模型，国产开源旗舰之一。

上下文窗口

128K

输入价格

—

输出价格

—

GLM-4-Plus

Zhipu

智谱 GLM-4-Plus：闭源旗舰版（2024），综合能力强。

上下文窗口

—

输入价格

—

输出价格

—

Kimi

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking：256K 上下文、1T 参（32B 激活）MoE，专注深度推理，开源权重。

上下文窗口

256K

输入价格

—

输出价格

—

Kimi K2.6

Moonshot

Moonshot Kimi 系列，当前 Intelligence Index 排名最高的开源权重模型之一。

上下文窗口

—

输入价格

—

输出价格

—

Kimi K2.5

Moonshot

Moonshot Kimi K2.5：256K 上下文、1T 总参（32B 激活）MoE + 视觉，开源权重，K2 的多模态升级。

上下文窗口

256K

输入价格

—

输出价格

—

Kimi K2

Moonshot

Kimi K2：128K–256K 上下文、1T 总参（32B 激活）MoE，15.5T token 训练，开源权重。

上下文窗口

256K

输入价格

—

输出价格

—

Step 阶跃星辰

Step-3.7-Flash

StepFun

阶跃星辰 Step-3.7-Flash：2026 年最新开源（Apache 2.0）快速款。

上下文窗口

—

输入价格

—

输出价格

—

Step-3.5-Flash

StepFun

阶跃星辰 Step-3.5-Flash：196B-A11B MoE，256K 上下文，支持工具调用，开源（Apache 2.0）。

上下文窗口

256K

输入价格

—

输出价格

—

Step-3

StepFun

阶跃星辰 Step-3：2025 年发布的大模型，主打多模态与大规模参数。

上下文窗口

—

输入价格

—

输出价格

—

Step-2

StepFun

阶跃星辰 Step-2：万亿参数级 LLM（2024），国产大模型代表之一。

上下文窗口

—

输入价格

—

输出价格

—

Mistral

Mistral Large

Mistral

欧洲最强 AI 模型，多语言能力出色，支持 Function Calling，适合欧洲合规场景

上下文窗口

128K

输入价格

$2 / 1M

输出价格

$6 / 1M

Mistral Large 2

Mistral

Mistral 旗舰，128K 上下文，多语言与代码能力强，欧洲开放权重代表。

上下文窗口

128K

输入价格

—

输出价格

—

Mixtral 8x22B

Mistral

Mistral 旗舰 MoE 架构开源模型，1410 亿参数激活 390 亿，性能与成本的最佳平衡

上下文窗口

64K

输入价格

开源免费

输出价格

开源免费

Codestral

Mistral

Mistral 代码专项模型，支持 80+ 编程语言，代码补全与生成。

上下文窗口

32K

输入价格

—

输出价格

—

Mixtral 8x7B

Mistral

Mistral 经典 MoE 模型，8×7B 专家，开源、轻量高效，部署广泛。

上下文窗口

32K

输入价格

—

输出价格

—

其他模型

QwQ-32B

Alibaba

通义千问推理专项开源模型，320 亿参，数学与逻辑推理表现突出。

上下文窗口

128K

输入价格

—

输出价格

—