按发生时间倒序排列,最新在前。共 8 条匹配。按重要性筛选用下方「影响」chip。
Realtime API 支持 WebRTC,实现浏览器端实时音频流和低延迟语音交互。
GPT Realtime 和 Audio 模型 GA,新增图像输入、异步 Function Calling、对话模式等,语音 Agent 能力全面成熟。
Realtime API 支持 SIP 协议,可直接接入电话网络,打通语音 Agent 到 PSTN 的最后一步。
Realtime-mini 模型在指令遵循和 Function Calling 上达到与完整版持平,语音 Agent 能力下沉到轻量模型。
Azure 发布 GPT-Realtime-1.5 和 GPT-Audio-1.5,提升指令遵循、多语言支持和 Tool Calling 能力。
火山方舟新增了多项多模态理解与生成教程,包括Doubao Seedance 2.0和Seedream 4.0-5.0等。
MiniMax 平台的语音资源包支持多模态接口,并赠送快速克隆音色。
Introducing Claude Opus 4.7
Anthropic 发布 Opus 4.7 旗舰模型,全面提升编程、Agent、视觉和多步骤任务能力。