AI 竞品情报
← 时间线|Google (Gemini / Vertex / Agent Enterprise) 全部动态 →
Google (Gemini / Vertex / Agent Enterprise)重要能力增强blog发生于 2026-03-26

Gemini 3.1 Flash Live:让音频 AI 更自然可靠

Gemini 3.1 Flash Live: Making audio AI more natural and reliable

https://deepmind.google/blog/rss.xml

对我们的启示

💡
可借鉴实时语音交互的低延迟优化值得关注,对我们的 Agent 语音交互体验有参考意义,但非当前核心优先级。

战略视角

Gemini 3.1 Flash Live 聚焦于「低延迟 + 高精度」的实时语音交互,这是构建语音 Agent 的关键基础设施。对我们的启示:如果百炼的 Agent 未来要支持实时语音对话,低延迟音频模型是必备能力。Google 通过 Flash Live 正在定义「语音 Agent」的技术标准——流畅、自然、低延迟。虽然我们当前主线不在语音 Agent,但随着 MCP 和 Agent Runtime 向多模态延伸,语音能力会越来越重要。建议观察其 API 开放节奏和开发者采用情况,作为中长期能力储备参考。

一句话摘要

Google 发布 Gemini 3.1 Flash Live,提升语音模型精度和低延迟,优化实时语音交互体验。

详细描述

Google released Gemini 3.1 Flash Live, a voice model with improved precision and lower latency for more fluid, natural voice interactions.

Google 发布 Gemini 3.1 Flash Live 语音模型,提升精度并降低延迟,使语音交互更流畅自然。

原文摘录

Our latest voice model has improved precision and lower latency to make voice interactions more fluid, natural and precise.