按发生时间倒序排列,最新在前。共 8 条匹配。按重要性筛选用下方「影响」chip。
Realtime API 支持 WebRTC,实现浏览器端实时音频流和低延迟语音交互。
GPT Realtime 和 Audio 模型 GA,新增图像输入、异步 Function Calling、对话模式等,语音 Agent 能力全面成熟。
Realtime-mini 模型在指令遵循和 Function Calling 上达到与完整版持平,语音 Agent 能力下沉到轻量模型。
ASR 模型重大升级:WER 降低约 50%,静音幻觉减少 4 倍,多语言性能提升。
Azure 发布 GPT-Realtime-1.5 和 GPT-Audio-1.5,提升指令遵循、多语言支持和 Tool Calling 能力。
Azure 发布 GPT Realtime 2.0 概念文档,涵盖推理支持、响应分阶段和更严格的指令遵循。
Higher usage limits for Claude and a compute deal with SpaceX
Anthropic 提升 Claude 使用上限并与 SpaceX 达成算力合作,暗示推理基础设施扩张。
Context Caching on Disk Technology
DeepSeek 推出基于硬盘的上下文缓存技术,通过降低缓存存储成本实现大幅降价,是推理成本优化的创新方案。