按发生时间倒序排列,最新在前。共 79 条匹配。按重要性筛选用下方「影响」chip。
Sora 支持图像到视频生成,可指定图像出现的帧位置。
Sora 支持视频到视频生成,可输入短片生成长视频。
GPT-5-codex 发布,专为 Codex CLI 和 VS Code 扩展设计,面向 Coding Agent 场景。
Azure 内置 PII 检测内容过滤器,可在 LLM 输出中识别并阻止敏感个人信息。
GPT-image-1-mini 全球可用,轻量版图像生成模型,不支持编辑和输入保真度。
Azure 发布说话人分离 ASR 模型 gpt-4o-transcribe-diarize,支持 100+ 语言实时转写并标注说话人。
Realtime API 支持 SIP 协议,可直接接入电话网络,打通语音 Agent 到 PSTN 的最后一步。
TTS 模型升级,多语言合成更自然,改善说话人相似度和减少音频瑕疵。
Realtime-mini 模型在指令遵循和 Function Calling 上达到与完整版持平,语音 Agent 能力下沉到轻量模型。
ASR 模型重大升级:WER 降低约 50%,静音幻觉减少 4 倍,多语言性能提升。