AI 竞品情报
线上 · resumization.cn
← 时间线|Microsoft Azure AI Foundry 全部动态 →
Microsoft Azure AI Foundry重要能力增强changelog~抓取于 2026-05-24

Realtime-mini speech-to-speech model update

https://learn.microsoft.com/en-us/azure/ai-services/openai/whats-new

对我们的启示

💡
要做轻量级语音模型具备完整 Function Calling 能力将大幅降低语音 Agent 成本,直接影响我们 Agent 方案的竞争力。

战略视角

Realtime-mini 实现 Function Calling 功能对齐是一个信号:语音 Agent 不再是高成本专属能力,轻量模型让开发者可以低成本构建语音+工具调用的 Agent。这在 Agent Runtime 赛道意味着:1)语音 Agent 将从 demo 走向规模化部署;2)开发者会期待平台提供从语音输入→Function Calling→语音输出的端到端调试体验。如果我们的 Console/Playground 不支持语音 Agent 调试链路,将明显落后。建议立即评估:Playground 是否支持语音模式的 Function Calling 可视化调试?Agent Runtime 是否原生支持 speech-to-speech pipeline?这是窗口期较短的行动项。

一句话摘要

Realtime-mini 模型在指令遵循和 Function Calling 上达到与完整版持平,语音 Agent 能力下沉到轻量模型。

详细描述

gpt-realtime-mini-2025-12-15 achieves feature parity with full gpt-realtime model in instruction-following and function-calling. Input and output are both audio, API-only deployment.

原文摘录

Feature parity with full gpt-realtime model in instruction-following and function-calling. Input and output are both audio, and deployment is API-only.