AI 竞品情报
线上 · resumization.cn

时间线

按发生时间倒序排列,最新在前。共 8 条匹配。按重要性筛选用下方「影响」chip。

里程碑行业级事件(新模型家族 / 新平台范式 / 重大降价)重要核心能力增强 / 价格调整 / 重要合作常规小修小补 / 文档更新
Microsoft Azure AI Foundry重要能力增强changelog多模态低延迟Agent RuntimePlayground~2026-05-24

Realtime API preview support for WebRTC

Realtime API 支持 WebRTC,实现浏览器端实时音频流和低延迟语音交互。

💡
要做WebRTC 支持让语音 Agent 可直接在浏览器中运行,是开发者体验的关键一环,我们需要在 Playground 中提供类似能力。
Microsoft Azure AI Foundry里程碑新发布changelog多模态低延迟Tool UseFunction Calling~2026-05-24

Realtime API audio models General Availability

GPT Realtime 和 Audio 模型 GA,新增图像输入、异步 Function Calling、对话模式等,语音 Agent 能力全面成熟。

💡
要做语音 Agent 核心能力 GA 是行业里程碑,异步 Function Calling + 对话模式直接定义语音 Agent 交互范式,我们必须对标。
Microsoft Azure AI Foundry重要能力增强changelog多模态低延迟Tool UseFunction Calling~2026-05-24

Realtime-mini speech-to-speech model update

Realtime-mini 模型在指令遵循和 Function Calling 上达到与完整版持平,语音 Agent 能力下沉到轻量模型。

💡
要做轻量级语音模型具备完整 Function Calling 能力将大幅降低语音 Agent 成本,直接影响我们 Agent 方案的竞争力。
Microsoft Azure AI Foundry重要能力增强changelog多模态低延迟效果提升~2026-05-24

Automatic speech recognition model update: gpt-4o-mini-transcribe

ASR 模型重大升级:WER 降低约 50%,静音幻觉减少 4 倍,多语言性能提升。

💡
可借鉴ASR 能力提升对语音 Agent 体验有间接影响,我们可通过集成方式受益,无需自研模型。
Microsoft Azure AI Foundry重要新发布changelog多模态低延迟Tool UseFunction Calling~2026-05-24

GPT-Realtime-1.5 and GPT-Audio-1.5 models released

Azure 发布 GPT-Realtime-1.5 和 GPT-Audio-1.5,提升指令遵循、多语言支持和 Tool Calling 能力。

💡
要做实时语音+Tool Calling 是 Agent 的关键能力组合,竞争对手已在迭代,我们需评估自身语音 Agent 方案的差距。
Microsoft Azure AI Foundry常规其他changelog低延迟文档~2026-05-24

GPT Realtime 2.0 concept articles published

Azure 发布 GPT Realtime 2.0 概念文档,涵盖推理支持、响应分阶段和更严格的指令遵循。

💡
可借鉴实时语音模型的产品形态演进值得关注,但当前仅为文档发布,我们可观察其 Reasoning + Realtime 融合方向。
Anthropic重要能力增强news低延迟免费额度新基建2026-05-06

Claude 用量上限提升及与 SpaceX 计算合作

Higher usage limits for Claude and a compute deal with SpaceX

Anthropic 提升 Claude 使用上限并与 SpaceX 达成算力合作,暗示推理基础设施扩张。

💡
可借鉴用量上限提升直接影响开发者体验,SpaceX 算力合作暗示 Anthropic 在推理基础设施上的创新,值得关注其对吞吐量和延迟的影响。
DeepSeek Platform重要能力增强changelog长上下文低延迟降价2024-08-02

上下文硬盘缓存技术上线

Context Caching on Disk Technology

DeepSeek 推出基于硬盘的上下文缓存技术,通过降低缓存存储成本实现大幅降价,是推理成本优化的创新方案。

💡
要做上下文缓存是长上下文推理降本的核心技术,硬盘缓存方案可能改变成本结构,直接影响我们 Token Plan 和推理服务的定价竞争力。
18 条 / 共 8
每页102050
← 上一页1 / 1下一页 →