AI 竞品情报
线上 · resumization.cn

时间线

按发生时间倒序排列,最新在前。共 6 条匹配。按重要性筛选用下方「影响」chip。

里程碑行业级事件(新模型家族 / 新平台范式 / 重大降价)重要核心能力增强 / 价格调整 / 重要合作常规小修小补 / 文档更新
Microsoft Azure AI Foundry重要新发布changelog多模态效果提升~2026-05-24

GPT-4o audio diarization model released

Azure 发布说话人分离 ASR 模型 gpt-4o-transcribe-diarize,支持 100+ 语言实时转写并标注说话人。

💡
可借鉴说话人分离是会议 Agent 场景的重要能力,但可通过集成实现,非平台核心差异化。
Microsoft Azure AI Foundry常规能力增强changelog多模态效果提升~2026-05-24

Text to speech model update: gpt-4o-mini-tts

TTS 模型升级,多语言合成更自然,改善说话人相似度和减少音频瑕疵。

💡
可借鉴TTS 能力提升改善语音 Agent 输出体验,但我们可通过集成方式获取,不需要自研。
Microsoft Azure AI Foundry重要能力增强changelog多模态低延迟效果提升~2026-05-24

Automatic speech recognition model update: gpt-4o-mini-transcribe

ASR 模型重大升级:WER 降低约 50%,静音幻觉减少 4 倍,多语言性能提升。

💡
可借鉴ASR 能力提升对语音 Agent 体验有间接影响,我们可通过集成方式受益,无需自研模型。
Microsoft Azure AI Foundry重要新发布changelog多模态效果提升~2026-05-24

GPT-image-1.5 model now available

Azure 上线 GPT-image-1.5,提升图像生成质量、编辑控制和面部保留能力,支持高输入保真度编辑。

💡
可借鉴图像生成非我们 MaaS 主线(聚焦 Agent/开发者体验),但多模态能力趋势值得关注,可作为参考。
Microsoft Azure AI Foundry常规其他changelog多模态文档~2026-05-24

GPT Realtime Translate and GPT Realtime Whisper concept articles

Azure 发布 Realtime Translate 和 Realtime Whisper 概念文档,覆盖实时翻译和低延迟流式转录场景。

💡
可借鉴实时翻译和流式转录是语音 AI 的重要应用场景,我们可参考其产品定位思路,但暂无对标压力。
Anthropic重要新发布news多模态Computer UsePlayground2026-04-17

Anthropic Labs 推出 Claude Design

Introducing Claude Design by Anthropic Labs

Anthropic 推出 Labs 实验产品 Claude Design,支持 AI 辅助视觉创作(设计/原型/PPT 等)。

💡
可借鉴Claude Design 是面向终端用户的设计工具而非开发者平台能力,但多模态生成+协作的设计范式可借鉴到我们的 Playground 体验设计。
16 条 / 共 6
每页102050
← 上一页1 / 1下一页 →