按发生时间倒序排列,最新在前。共 5 条匹配。按重要性筛选用下方「影响」chip。
Azure 发布说话人分离 ASR 模型 gpt-4o-transcribe-diarize,支持 100+ 语言实时转写并标注说话人。
TTS 模型升级,多语言合成更自然,改善说话人相似度和减少音频瑕疵。
ASR 模型重大升级:WER 降低约 50%,静音幻觉减少 4 倍,多语言性能提升。
Azure 上线 GPT-image-1.5,提升图像生成质量、编辑控制和面部保留能力,支持高输入保真度编辑。
Azure 发布 Realtime Translate 和 Realtime Whisper 概念文档,覆盖实时翻译和低延迟流式转录场景。