EN
返回资讯列表
行业

OpenAI联合博通发布自研推理芯片Jalapeño,9个月流片创纪录

2026年6月24日,OpenAI联合博通正式发布首款自研推理加速芯片Jalapeño,专为大语言模型推理场景定制。该芯片从设计到流片仅耗时9个月,创下高性能ASIC开发周期新纪录。工程样片已成功运行GPT-5.3-Codex-Spark等前沿模型,早期测试显示每瓦性能大幅领先当前主流AI加速硬件。

芯片设计与合作

Jalapeño由OpenAI主导架构设计,博通负责芯片实现与网络互联,Celestica承担板卡与系统集成。芯片架构针对大模型推理优化,通过减少数据搬运、平衡算力与内存资源,提升实际利用率。博通Tomahawk交换芯片为大规模部署提供底层支撑。OpenAI硬件团队由前谷歌TPU高级工程总监Richard Ho领导,其团队利用自研AI模型辅助芯片设计,加速了开发流程。

性能与部署

OpenAI尚未公布具体性能基准,但表示早期测试显示每瓦性能显著优于当前最先进水平。Jalapeño计划于2026年底在微软等合作伙伴的数据中心启动首批部署,目标建设吉瓦级超大规模集群。该芯片是双方多代AI计算平台的首款产品,未来将持续迭代。

对英伟达的影响

Jalapeño的推出可能对英伟达产生多方面影响:

  • 短期:OpenAI自身推理GPU采购将大幅削减,推理成本预计下降约50%;高速网络业务转向博通以太网方案,替代英伟达NVLink。
  • 中长期:推理市场ASIC份额持续增长,Counterpoint预测2026年定制ASIC在推理服务器占比达27.8%;Meta、Anthropic等可能跟进自研芯片,形成ASIC阵营。
  • 生态:推理场景对CUDA依赖减弱,ASIC可配套轻量化软件栈;OpenAI实现“模型-芯片-数据中心”全栈自研,削弱英伟达中间商地位。

行业背景与趋势

OpenAI是继谷歌、亚马逊、微软、Meta之后又一家自研AI芯片的科技巨头。谷歌TPU(2016年)、亚马逊Inferentia(2018年)和Trainium(2022年)、微软Azure Maia(2023年)均先后面世。OpenAI总裁Greg Brockman表示,算力驱动经济时代,自主掌控硬件是核心战略。Jalapeño的快速流片验证了“AI大厂+芯片代工厂”定制ASIC模式的高效性,可能加速行业自研浪潮。

2026年6月25日来源:综合整理

延伸阅读

想深入了解该主题,查看站内相关教程与解析。

查看相关主题