technology
OpenAI Realtime API正式商用:低延迟语音AI交互开放生态
OpenAI Realtime API正式向所有开发者开放,支持200ms以内延迟的双向语音对话,内置语音活动检测(VAD)和端点检测。相比传统ASR+LLM+TTS管道,情感和语气保留更好。GPT-4o Audio模型支持语音输入输出,定价:输入0.1美元/分钟,输出0.2美元/分钟。大量语音AI应用将基于此构建。
2025年9月16日来源:OpenAI
OpenAIRealtime API语音AIAI语音语音交互