模型重点
OpenAI o3 mini 正式发布:推理模型平民化,$0.15 每百万 token
OpenAI 发布 o3 mini:让推理模型不再是奢侈品
2026年5月,OpenAI 正式推出 o3 mini,将旗舰推理模型 o3 的核心能力打包进价格极低的版本——$0.15/1M input tokens,比 o3 的 $15/1M 便宜 100 倍。
核心性能数据
o3 mini 并不是 o3 的"阉割版"。在实际场景中表现超出预期:
| Benchmark | o3 mini | o3(旗舰) | GPT-4o |
|---|---|---|---|
| AIME 2024 | 63.4% | 96.7% | 13.4% |
| GPQA Diamond | 71.2% | 87.7% | 53.0% |
| SWE-bench | 49.3% | 71.7% | 38.0% |
o3 mini 的数学推理能力比 GPT-4o 高出近 50 个百分点,接近专业竞赛参赛水平。
三种"思考力度"可调节
o3 mini 引入了 reasoning_effort 参数:
- low:最快,约 3-5 秒,适合简单推理
- medium(默认):约 8-15 秒,平衡速度和深度
- high:约 30-60 秒,接近 o3 的推理质量
from openai import OpenAI
client = OpenAI()
response = client.chat.completions.create(
model="o3-mini",
messages=[{"role": "user", "content": "证明√2是无理数"}],
reasoning_effort="high"
)
定价对比(2026年5月)
| 模型 | Input | Output |
|---|---|---|
| o3 mini | $0.15/1M | $0.60/1M |
| o3 | $15/1M | $60/1M |
| GPT-4o | $2.50/1M | $10/1M |
| GPT-4o mini | $0.15/1M | $0.60/1M |
注意:o3 mini 与 GPT-4o mini 定价相同,但在数学和代码推理能力上远超后者。
什么时候用 o3 mini?
适合:需要推理能力但预算有限的 AI 应用、数学题解题类 Agent、代码调试和算法实现、科学数据分析。
不适合:日常对话文本生成(GPT-4o mini 更便宜且够用)、需要视觉输入(o3 mini 不支持图像)。
行业影响
o3 mini 意味着"推理型 AI"终于有了普及价格。此前企业在考虑 o3 时因成本望而却步;现在同样的推理能力可以以 1% 的成本部署。
预计接下来 3 个月,数学辅导、代码审查、科学研究类 AI 应用会迎来一波爆发——这些场景此前因推理模型成本过高一直没能大规模落地。
2026年5月20日来源:AI Skill Navigation
o3 miniOpenAI推理模型大模型发布AI价格reasoning