按发生时间倒序排列,最新在前。共 49 条匹配。按重要性筛选用下方「影响」chip。
Realtime API 支持 WebRTC,实现浏览器端实时音频流和低延迟语音交互。
Sora 视频生成模型在 Azure 上预览发布,支持文本到视频生成。
codex-mini 和 o3-pro 两款新推理模型发布,丰富推理模型产品矩阵。
Provisioned spillover 正式 GA,预留实例超限流量自动溢出到标准部署,提升资源利用率。
GPT-5-codex 发布,专为 Codex CLI 和 VS Code 扩展设计,面向 Coding Agent 场景。
Azure 内置 PII 检测内容过滤器,可在 LLM 输出中识别并阻止敏感个人信息。
Azure 发布说话人分离 ASR 模型 gpt-4o-transcribe-diarize,支持 100+ 语言实时转写并标注说话人。
Realtime API 支持 SIP 协议,可直接接入电话网络,打通语音 Agent 到 PSTN 的最后一步。
Realtime-mini 模型在指令遵循和 Function Calling 上达到与完整版持平,语音 Agent 能力下沉到轻量模型。
ASR 模型重大升级:WER 降低约 50%,静音幻觉减少 4 倍,多语言性能提升。
Azure 上线 GPT-image-1.5,提升图像生成质量、编辑控制和面部保留能力,支持高输入保真度编辑。
Azure 发布 GPT-Realtime-1.5 和 GPT-Audio-1.5,提升指令遵循、多语言支持和 Tool Calling 能力。
Anthropic Provides Advanced Features Such as Code Execution and Web Search
Anthropic提供了一些高级功能,如代码执行和网络搜索,这些功能可以提高开发者的使用体验。
Anthropic Offers Multiple Pricing Plans for Different User Needs
Anthropic推出了多种定价计划,包括免费、专业版、团队版和企业版,以适应不同的用户需求。
谷歌发布了Gemini for Science,这是一个新的科学工具和实验集合,旨在扩大科学探索的规模和精度。
Break the context window barrier with Amazon Bedrock AgentCore
本文介绍了如何使用Amazon Bedrock AgentCore Code Interpreter和Strands Agents SDK实现递归语言模型(RLM),从而处理任意长度的文档,并利用Bedrock AgentCore Code Interpreter作为持久的工作内存进行迭代文档分析。
AWS launches frontier agents for security testing and cloud operations
AWS发布了用于安全测试和云操作的前沿Agent,这些自主系统可以独立工作,大规模处理并发任务,并在没有持续人工监督的情况下长时间运行。
亚马逊Bedrock推出了优先级和灵活层级,分别比标准层级价格高75%和低50%。
亚马逊Bedrock为特定基础模型提供比按需推理低50%的批量推理价格。
微软Foundry本地版1.1增加了实时转录、嵌入、Responses API等功能。