AI 竞品情报
线上 · resumization.cn
← 时间线|Microsoft Azure AI Foundry 全部动态 →
Microsoft Azure AI Foundry重要能力增强changelog~抓取于 2026-05-24

Automatic speech recognition model update: gpt-4o-mini-transcribe

https://learn.microsoft.com/en-us/azure/ai-services/openai/whats-new

对我们的启示

💡
可借鉴ASR 能力提升对语音 Agent 体验有间接影响,我们可通过集成方式受益,无需自研模型。

战略视角

WER 降低 50% 和静音幻觉减少 4 倍直接提升语音 Agent 在嘈杂环境下的可靠性,这对客服、会议转录等 B2B 场景至关重要。影响的是构建语音应用的开发者——更准确的 ASR 意味着下游 NLU 和 Agent 决策质量提升。我们作为 MaaS 平台,应关注如何在 Console/Playground 中让开发者便捷对比和选择不同 ASR 模型,而非自研。可考虑在平台中集成此类高质量 ASR 模型作为语音 Agent pipeline 的推荐组件。

一句话摘要

ASR 模型重大升级:WER 降低约 50%,静音幻觉减少 4 倍,多语言性能提升。

详细描述

New gpt-4o-mini-transcribe-2025-12-15 with ~50% lower word error rate (WER) than previous model on English benchmarks, improved multilingual performance, and up to 4× reduction in silence hallucinations.

原文摘录

Improved transcription accuracy and robustness for real-time scenarios, with approximately 50% lower word error rate (WER) than the previous gpt-4o-transcribe-mini model on English benchmarks. Reduces hallucinations on silence by up to 4×.