按发生时间倒序排列,最新在前。共 33 条匹配。按重要性筛选用下方「影响」chip。
Realtime API 支持 WebRTC,实现浏览器端实时音频流和低延迟语音交互。
GPT-5 家族四款模型发布:GPT-5(需注册)、GPT-5-mini、GPT-5-nano、GPT-5-chat,覆盖从旗舰到轻量的完整产品线。
GPT Realtime 和 Audio 模型 GA,新增图像输入、异步 Function Calling、对话模式等,语音 Agent 能力全面成熟。
GPT-5-codex 发布,专为 Codex CLI 和 VS Code 扩展设计,面向 Coding Agent 场景。
Azure 内置 PII 检测内容过滤器,可在 LLM 输出中识别并阻止敏感个人信息。
Realtime API 支持 SIP 协议,可直接接入电话网络,打通语音 Agent 到 PSTN 的最后一步。
Realtime-mini 模型在指令遵循和 Function Calling 上达到与完整版持平,语音 Agent 能力下沉到轻量模型。
Azure 发布 GPT-Realtime-1.5 和 GPT-Audio-1.5,提升指令遵循、多语言支持和 Tool Calling 能力。
Anthropic Provides Advanced Features Such as Code Execution and Web Search
Anthropic提供了一些高级功能,如代码执行和网络搜索,这些功能可以提高开发者的使用体验。
谷歌发布了Gemini for Science,这是一个新的科学工具和实验集合,旨在扩大科学探索的规模和精度。
Break the context window barrier with Amazon Bedrock AgentCore
本文介绍了如何使用Amazon Bedrock AgentCore Code Interpreter和Strands Agents SDK实现递归语言模型(RLM),从而处理任意长度的文档,并利用Bedrock AgentCore Code Interpreter作为持久的工作内存进行迭代文档分析。
AWS launches frontier agents for security testing and cloud operations
AWS发布了用于安全测试和云操作的前沿Agent,这些自主系统可以独立工作,大规模处理并发任务,并在没有持续人工监督的情况下长时间运行。
亚马逊Bedrock推出了优先级和灵活层级,分别比标准层级价格高75%和低50%。
亚马逊Bedrock为特定基础模型提供比按需推理低50%的批量推理价格。
微软Foundry本地版1.1增加了实时转录、嵌入、Responses API等功能。
微软Foundry在2026年4月发布了一系列新模型(如GPT-5.5、GPT-image-2等)以及新的开发工具和框架。
火山方舟新增了多项多模态理解与生成教程,包括Doubao Seedance 2.0和Seedream 4.0-5.0等。
火山方舟更新了多个模型的价格,可能影响市场竞争力。
Kimi 发布了新的多模态模型 K2.6,提升了长程代码编写能力。
Kimi发布了K2.6多模态模型,增强了长程代码编写能力,并支持多种输入类型。
MiniMax 平台的语音资源包支持多模态接口,并赠送快速克隆音色。
智谱大模型开放平台提供了多种开发方式,满足不同开发者的需求和技术栈偏好。
智谱大模型开放平台提供了多种多模态模型,支持各种应用场景。
Anthropic acquires Stainless
Anthropic 收购 API 基础设施/SDK 工具公司 Stainless,将大幅强化开发者体验和 API 生态。
Agents for financial services
Anthropic 推出金融服务业专用 Agent 方案,垂直行业 Agent 化趋势加速。
Building a new enterprise AI services company with Blackstone, Hellman & Friedman, and Goldman Sachs
Anthropic 联手顶级金融资本成立企业 AI 服务公司,将大规模推进企业级 AI 落地。
Input Cache Hit Price Reduced to 1/10 of Launch Price
DeepSeek Platform将所有模型的输入缓存命中价格降至发布价格的1/10。
DeepSeek-V4 Released: V4-Pro and V4-Flash
DeepSeek 发布全新 V4 代模型家族(Pro/Flash),同时兼容 OpenAI 和 Anthropic 接口,旧模型名将在三个月后废止,标志新一代模型体系正式确立。
Introducing Claude Opus 4.7
Anthropic 发布 Opus 4.7 旗舰模型,全面提升编程、Agent、视觉和多步骤任务能力。
DeepSeek-V3.1-Terminus: Fixes for Language Mixing and Agent Optimization
V3.1 的小版本升级,重点修复语言混用问题并强化 Coding Agent 和搜索 Agent,显示 DeepSeek 在 Agent 场景的持续投入。
DeepSeek-V3.1: Hybrid Reasoning Architecture with Major Agent Improvements
DeepSeek-V3.1 首次实现混合推理架构(单模型双模式),在 SWE-bench 和 Terminal-bench 上取得突破,Agent 和工具使用能力成为核心升级方向。
DeepSeek-R1-0528: Enhanced Reasoning, JSON Output, and Function Calling
R1 推理模型首次获得 Function Calling 和 JSON 输出能力,推理 benchmark 全面提升,使推理模型可在 Agent 场景中直接使用。
Context Caching on Disk Technology
DeepSeek 推出基于硬盘的上下文缓存技术,通过降低缓存存储成本实现大幅降价,是推理成本优化的创新方案。