AI 竞品情报
线上 · resumization.cn

Microsoft Azure AI Foundry

3里程碑
14重要
10常规
Microsoft Azure AI Foundry里程碑新发布changelog推理效果提升Tool Use~2026-05-24

GPT-5 family models released: gpt-5, gpt-5-mini, gpt-5-nano, gpt-5-chat

GPT-5 家族四款模型发布:GPT-5(需注册)、GPT-5-mini、GPT-5-nano、GPT-5-chat,覆盖从旗舰到轻量的完整产品线。

💡
要做GPT-5 家族是行业基准模型更新,直接影响开发者对平台模型能力的心智定位,我们必须评估差距并跟进。
Microsoft Azure AI Foundry里程碑新发布changelog多模态低延迟Tool UseFunction Calling~2026-05-24

Realtime API audio models General Availability

GPT Realtime 和 Audio 模型 GA,新增图像输入、异步 Function Calling、对话模式等,语音 Agent 能力全面成熟。

💡
要做语音 Agent 核心能力 GA 是行业里程碑,异步 Function Calling + 对话模式直接定义语音 Agent 交互范式,我们必须对标。
Microsoft Azure AI Foundry里程碑新发布blog~2026-05-23

What's new in Microsoft Foundry | April 2026

微软Foundry在2026年4月发布了一系列新模型(如GPT-5.5、GPT-image-2等)以及新的开发工具和框架。

💡
要做我们应立即评估并接入这些新模型和工具,以增强我们的MaaS平台竞争力。
Microsoft Azure AI Foundry重要能力增强changelog多模态低延迟Agent RuntimePlayground~2026-05-24

Realtime API preview support for WebRTC

Realtime API 支持 WebRTC,实现浏览器端实时音频流和低延迟语音交互。

💡
要做WebRTC 支持让语音 Agent 可直接在浏览器中运行,是开发者体验的关键一环,我们需要在 Playground 中提供类似能力。
Microsoft Azure AI Foundry重要新发布changelog多模态~2026-05-24

Sora video generation released (preview)

Sora 视频生成模型在 Azure 上预览发布,支持文本到视频生成。

💡
暂不跟进视频生成是创意工具场景,非 MaaS 平台核心能力方向。
Microsoft Azure AI Foundry重要新发布changelog推理Coding Agent~2026-05-24

New models codex-mini and o3-pro released

codex-mini 和 o3-pro 两款新推理模型发布,丰富推理模型产品矩阵。

💡
可借鉴codex-mini 定位 Coding 轻量推理,o3-pro 定位高端推理,我们需关注 Coding 推理模型的产品化方向。
Microsoft Azure AI Foundry重要能力增强changelogSLA~2026-05-24

Provisioned spillover General Availability

Provisioned spillover 正式 GA,预留实例超限流量自动溢出到标准部署,提升资源利用率。

💡
可借鉴弹性资源调度对 MaaS 平台成本优化有参考价值,但实现机制依赖于底层基础设施差异,可借鉴思路。
Microsoft Azure AI Foundry重要新发布changelogCode ExecutionCoding AgentAgent Runtime~2026-05-24

GPT-5-codex now available

GPT-5-codex 发布,专为 Codex CLI 和 VS Code 扩展设计,面向 Coding Agent 场景。

💡
要做Coding Agent 是我们核心赛道之一,GPT-5-codex 直接对标这一场景,我们需要评估自身 Coding 能力差距。
Microsoft Azure AI Foundry重要新发布changelog安全合规~2026-05-24

PII detection content filter built-in

Azure 内置 PII 检测内容过滤器,可在 LLM 输出中识别并阻止敏感个人信息。

💡
要做PII 检测是企业级 MaaS 平台的安全合规刚需,我们需要提供类似的内容安全能力来服务企业客户。
Microsoft Azure AI Foundry重要新发布changelog多模态效果提升~2026-05-24

GPT-4o audio diarization model released

Azure 发布说话人分离 ASR 模型 gpt-4o-transcribe-diarize,支持 100+ 语言实时转写并标注说话人。

💡
可借鉴说话人分离是会议 Agent 场景的重要能力,但可通过集成实现,非平台核心差异化。
Microsoft Azure AI Foundry重要能力增强changelog多模态Agent Runtime集成~2026-05-24

Realtime API support for SIP

Realtime API 支持 SIP 协议,可直接接入电话网络,打通语音 Agent 到 PSTN 的最后一步。

💡
要做SIP 支持让语音 Agent 直接接入电话网,是 Agent 落地的关键基础设施,我们需要评估是否提供类似能力。
Microsoft Azure AI Foundry重要能力增强changelog多模态低延迟Tool UseFunction Calling~2026-05-24

Realtime-mini speech-to-speech model update

Realtime-mini 模型在指令遵循和 Function Calling 上达到与完整版持平,语音 Agent 能力下沉到轻量模型。

💡
要做轻量级语音模型具备完整 Function Calling 能力将大幅降低语音 Agent 成本,直接影响我们 Agent 方案的竞争力。
Microsoft Azure AI Foundry重要能力增强changelog多模态低延迟效果提升~2026-05-24

Automatic speech recognition model update: gpt-4o-mini-transcribe

ASR 模型重大升级:WER 降低约 50%,静音幻觉减少 4 倍,多语言性能提升。

💡
可借鉴ASR 能力提升对语音 Agent 体验有间接影响,我们可通过集成方式受益,无需自研模型。
Microsoft Azure AI Foundry重要新发布changelog多模态效果提升~2026-05-24

GPT-image-1.5 model now available

Azure 上线 GPT-image-1.5,提升图像生成质量、编辑控制和面部保留能力,支持高输入保真度编辑。

💡
可借鉴图像生成非我们 MaaS 主线(聚焦 Agent/开发者体验),但多模态能力趋势值得关注,可作为参考。
Microsoft Azure AI Foundry重要新发布changelog多模态低延迟Tool UseFunction Calling~2026-05-24

GPT-Realtime-1.5 and GPT-Audio-1.5 models released

Azure 发布 GPT-Realtime-1.5 和 GPT-Audio-1.5,提升指令遵循、多语言支持和 Tool Calling 能力。

💡
要做实时语音+Tool Calling 是 Agent 的关键能力组合,竞争对手已在迭代,我们需评估自身语音 Agent 方案的差距。
Microsoft Azure AI Foundry重要新发布blog~2026-05-23

Foundry Local 1.1: Live Transcription, Embeddings, and Responses API

微软Foundry本地版1.1增加了实时转录、嵌入、Responses API等功能。

💡
要做我们需要评估这些新功能,并考虑如何在我们的平台上提供类似的能力。
Microsoft Azure AI Foundry重要能力增强blog~2026-05-23

Introducing Toolboxes in Foundry

微软Foundry推出Toolbox功能,简化了AI代理工具的配置和复用。

💡
可借鉴思路有价值,可作为产品迭代输入,但当下不必紧跟。
Microsoft Azure AI Foundry常规新发布changelogSDKConsole~2026-05-24

Model router (preview) released

Model router 预览发布,自动为每个 prompt 选择最优模型,优化成本与效果平衡。

💡
可借鉴智能路由降低开发者模型选择负担,值得在开发者体验优化中参考。
Microsoft Azure AI Foundry常规新发布changelogAgent Runtime安全~2026-05-24

Spotlighting for prompt shields (preview)

Prompt shields 新增 Spotlighting 功能,通过标记文档信任级别防御间接注入攻击。

💡
可借鉴间接注入攻击是 Agent 场景的重要安全威胁,Spotlighting 思路可借鉴,但技术方案可自行设计。
Microsoft Azure AI Foundry常规能力增强changelog多模态~2026-05-24

GPT-image-1 update: input fidelity and partial image streaming

GPT-image-1 新增 input_fidelity 参数和部分图像流式输出,提升编辑控制和用户体验。

💡
暂不跟进图像生成非 MaaS 主线,流式渲染思路可参考但不紧急。
Microsoft Azure AI Foundry常规能力增强changelogSDKConsole~2026-05-24

Model router now supports GPT-5 series models

Model router 新增 GPT-5 系列支持,自动路由选择最优模型。

💡
可借鉴智能路由是降本增效的有效手段,我们可参考其实现逻辑,但非紧急。
Microsoft Azure AI Foundry常规能力增强changelog多模态~2026-05-24

Sora image-to-video support

Sora 支持图像到视频生成,可指定图像出现的帧位置。

💡
暂不跟进视频生成非 MaaS 平台核心能力,暂不跟进。
Microsoft Azure AI Foundry常规能力增强changelog多模态~2026-05-24

Sora video-to-video support

Sora 支持视频到视频生成,可输入短片生成长视频。

💡
暂不跟进视频生成不在 MaaS 主线范围内,为 B2C 创意场景。
Microsoft Azure AI Foundry常规新发布changelog多模态~2026-05-24

GPT-image-1-mini model available for global deployments

GPT-image-1-mini 全球可用,轻量版图像生成模型,不支持编辑和输入保真度。

💡
暂不跟进图像生成轻量模型发布,非 MaaS 主线,无对标需求。
Microsoft Azure AI Foundry常规能力增强changelog多模态效果提升~2026-05-24

Text to speech model update: gpt-4o-mini-tts

TTS 模型升级,多语言合成更自然,改善说话人相似度和减少音频瑕疵。

💡
可借鉴TTS 能力提升改善语音 Agent 输出体验,但我们可通过集成方式获取,不需要自研。
Microsoft Azure AI Foundry常规其他changelog多模态文档~2026-05-24

GPT Realtime Translate and GPT Realtime Whisper concept articles

Azure 发布 Realtime Translate 和 Realtime Whisper 概念文档,覆盖实时翻译和低延迟流式转录场景。

💡
可借鉴实时翻译和流式转录是语音 AI 的重要应用场景,我们可参考其产品定位思路,但暂无对标压力。
Microsoft Azure AI Foundry常规其他changelog低延迟文档~2026-05-24

GPT Realtime 2.0 concept articles published

Azure 发布 GPT Realtime 2.0 概念文档,涵盖推理支持、响应分阶段和更严格的指令遵循。

💡
可借鉴实时语音模型的产品形态演进值得关注,但当前仅为文档发布,我们可观察其 Reasoning + Realtime 融合方向。