AI Infrastructure

NVIDIA H200 GPU 推动推理成本下降60%：对AI经济意味着什么

NVIDIA 的 H200 GPU 配备 HBM3e 内存，相比 H100，大语言模型推理成本降低 40-60%，这得益于 2 倍的内存带宽提升。云服务提供商将节省的成本传递给客户：自 2024 年底以来，AWS Bedrock 和 Google Cloud 已将 LLM 推理价格下调 30-50%。行业分析师预测，到 2027 年，AI 推理成本将继续以每年 40-50% 的速度下降，从根本上改变 AI 商业模型的经济性。

2025年5月13日来源：NVIDIA

NVIDIA H200 inference-cost GPU AI-economics

阅读原文

本条资讯来源于 NVIDIA，点击查看完整报道。

前往 NVIDIA

NVIDIA H200 GPU 推动推理成本下降60%：对AI经济意味着什么

Documentation

Getting Started

Learn more