AI 竞品情报
线上 · resumization.cn

时间线

按发生时间倒序排列,最新在前。共 79 条匹配。按重要性筛选用下方「影响」chip。

里程碑行业级事件(新模型家族 / 新平台范式 / 重大降价)重要核心能力增强 / 价格调整 / 重要合作常规小修小补 / 文档更新
Microsoft Azure AI Foundry常规能力增强changelog多模态~2026-05-24

Sora image-to-video support

Sora 支持图像到视频生成,可指定图像出现的帧位置。

💡
暂不跟进视频生成非 MaaS 平台核心能力,暂不跟进。
Microsoft Azure AI Foundry常规能力增强changelog多模态~2026-05-24

Sora video-to-video support

Sora 支持视频到视频生成,可输入短片生成长视频。

💡
暂不跟进视频生成不在 MaaS 主线范围内,为 B2C 创意场景。
Microsoft Azure AI Foundry重要新发布changelogCode ExecutionCoding AgentAgent Runtime~2026-05-24

GPT-5-codex now available

GPT-5-codex 发布,专为 Codex CLI 和 VS Code 扩展设计,面向 Coding Agent 场景。

💡
要做Coding Agent 是我们核心赛道之一,GPT-5-codex 直接对标这一场景,我们需要评估自身 Coding 能力差距。
Microsoft Azure AI Foundry重要新发布changelog安全合规~2026-05-24

PII detection content filter built-in

Azure 内置 PII 检测内容过滤器,可在 LLM 输出中识别并阻止敏感个人信息。

💡
要做PII 检测是企业级 MaaS 平台的安全合规刚需,我们需要提供类似的内容安全能力来服务企业客户。
Microsoft Azure AI Foundry常规新发布changelog多模态~2026-05-24

GPT-image-1-mini model available for global deployments

GPT-image-1-mini 全球可用,轻量版图像生成模型,不支持编辑和输入保真度。

💡
暂不跟进图像生成轻量模型发布,非 MaaS 主线,无对标需求。
Microsoft Azure AI Foundry重要新发布changelog多模态效果提升~2026-05-24

GPT-4o audio diarization model released

Azure 发布说话人分离 ASR 模型 gpt-4o-transcribe-diarize,支持 100+ 语言实时转写并标注说话人。

💡
可借鉴说话人分离是会议 Agent 场景的重要能力,但可通过集成实现,非平台核心差异化。
Microsoft Azure AI Foundry重要能力增强changelog多模态Agent Runtime集成~2026-05-24

Realtime API support for SIP

Realtime API 支持 SIP 协议,可直接接入电话网络,打通语音 Agent 到 PSTN 的最后一步。

💡
要做SIP 支持让语音 Agent 直接接入电话网,是 Agent 落地的关键基础设施,我们需要评估是否提供类似能力。
Microsoft Azure AI Foundry常规能力增强changelog多模态效果提升~2026-05-24

Text to speech model update: gpt-4o-mini-tts

TTS 模型升级,多语言合成更自然,改善说话人相似度和减少音频瑕疵。

💡
可借鉴TTS 能力提升改善语音 Agent 输出体验,但我们可通过集成方式获取,不需要自研。
Microsoft Azure AI Foundry重要能力增强changelog多模态低延迟Tool UseFunction Calling~2026-05-24

Realtime-mini speech-to-speech model update

Realtime-mini 模型在指令遵循和 Function Calling 上达到与完整版持平,语音 Agent 能力下沉到轻量模型。

💡
要做轻量级语音模型具备完整 Function Calling 能力将大幅降低语音 Agent 成本,直接影响我们 Agent 方案的竞争力。
Microsoft Azure AI Foundry重要能力增强changelog多模态低延迟效果提升~2026-05-24

Automatic speech recognition model update: gpt-4o-mini-transcribe

ASR 模型重大升级:WER 降低约 50%,静音幻觉减少 4 倍,多语言性能提升。

💡
可借鉴ASR 能力提升对语音 Agent 体验有间接影响,我们可通过集成方式受益,无需自研模型。
1120 条 / 共 79
每页102050