模型
GPT-4o 实时语音 + 函数调用:Agent 进入「听说做」新时代
OpenAI 大幅升级 GPT-4o 的实时 API,新增对话中途函数调用(mid-conversation function calling)能力,允许 Agent 在与用户实时对话的同时查询数据库、调用工具、执行代码,结果无缝回流对话。这一能力打通了语音 Agent 的最后一公里:Agent 不再只是「会说话的助手」,而是能在通话中实时帮你完成订单、查余额、操控系统的执行者。国内多家语音 SaaS 已宣布接入。
2025年3月28日来源:OpenAI Platform
GPT-4o实时语音函数调用语音Agent