按发生时间倒序排列,最新在前。共 33 条匹配。按重要性筛选用下方「影响」chip。
Realtime API 支持 WebRTC,实现浏览器端实时音频流和低延迟语音交互。
GPT-5 家族四款模型发布:GPT-5(需注册)、GPT-5-mini、GPT-5-nano、GPT-5-chat,覆盖从旗舰到轻量的完整产品线。
GPT Realtime 和 Audio 模型 GA,新增图像输入、异步 Function Calling、对话模式等,语音 Agent 能力全面成熟。
GPT-5-codex 发布,专为 Codex CLI 和 VS Code 扩展设计,面向 Coding Agent 场景。
Azure 内置 PII 检测内容过滤器,可在 LLM 输出中识别并阻止敏感个人信息。
Realtime API 支持 SIP 协议,可直接接入电话网络,打通语音 Agent 到 PSTN 的最后一步。
Realtime-mini 模型在指令遵循和 Function Calling 上达到与完整版持平,语音 Agent 能力下沉到轻量模型。
Azure 发布 GPT-Realtime-1.5 和 GPT-Audio-1.5,提升指令遵循、多语言支持和 Tool Calling 能力。
Anthropic Provides Advanced Features Such as Code Execution and Web Search
Anthropic提供了一些高级功能,如代码执行和网络搜索,这些功能可以提高开发者的使用体验。
谷歌发布了Gemini for Science,这是一个新的科学工具和实验集合,旨在扩大科学探索的规模和精度。
Break the context window barrier with Amazon Bedrock AgentCore
本文介绍了如何使用Amazon Bedrock AgentCore Code Interpreter和Strands Agents SDK实现递归语言模型(RLM),从而处理任意长度的文档,并利用Bedrock AgentCore Code Interpreter作为持久的工作内存进行迭代文档分析。
AWS launches frontier agents for security testing and cloud operations
AWS发布了用于安全测试和云操作的前沿Agent,这些自主系统可以独立工作,大规模处理并发任务,并在没有持续人工监督的情况下长时间运行。
亚马逊Bedrock推出了优先级和灵活层级,分别比标准层级价格高75%和低50%。
亚马逊Bedrock为特定基础模型提供比按需推理低50%的批量推理价格。
微软Foundry本地版1.1增加了实时转录、嵌入、Responses API等功能。
微软Foundry在2026年4月发布了一系列新模型(如GPT-5.5、GPT-image-2等)以及新的开发工具和框架。
火山方舟新增了多项多模态理解与生成教程,包括Doubao Seedance 2.0和Seedream 4.0-5.0等。
火山方舟更新了多个模型的价格,可能影响市场竞争力。
Kimi 发布了新的多模态模型 K2.6,提升了长程代码编写能力。
Kimi发布了K2.6多模态模型,增强了长程代码编写能力,并支持多种输入类型。