按发生时间倒序排列,最新在前。共 6 条匹配。按重要性筛选用下方「影响」chip。
Azure 发布说话人分离 ASR 模型 gpt-4o-transcribe-diarize,支持 100+ 语言实时转写并标注说话人。
TTS 模型升级,多语言合成更自然,改善说话人相似度和减少音频瑕疵。
ASR 模型重大升级:WER 降低约 50%,静音幻觉减少 4 倍,多语言性能提升。
Azure 上线 GPT-image-1.5,提升图像生成质量、编辑控制和面部保留能力,支持高输入保真度编辑。
Azure 发布 Realtime Translate 和 Realtime Whisper 概念文档,覆盖实时翻译和低延迟流式转录场景。
Introducing Claude Design by Anthropic Labs
Anthropic 推出 Labs 实验产品 Claude Design,支持 AI 辅助视觉创作(设计/原型/PPT 等)。