按发生时间倒序排列,最新在前。共 79 条匹配。按重要性筛选用下方「影响」chip。
Realtime API 支持 WebRTC,实现浏览器端实时音频流和低延迟语音交互。
Model router 预览发布,自动为每个 prompt 选择最优模型,优化成本与效果平衡。
Prompt shields 新增 Spotlighting 功能,通过标记文档信任级别防御间接注入攻击。
Sora 视频生成模型在 Azure 上预览发布,支持文本到视频生成。
codex-mini 和 o3-pro 两款新推理模型发布,丰富推理模型产品矩阵。
GPT-image-1 新增 input_fidelity 参数和部分图像流式输出,提升编辑控制和用户体验。
Model router 新增 GPT-5 系列支持,自动路由选择最优模型。
GPT-5 家族四款模型发布:GPT-5(需注册)、GPT-5-mini、GPT-5-nano、GPT-5-chat,覆盖从旗舰到轻量的完整产品线。
Provisioned spillover 正式 GA,预留实例超限流量自动溢出到标准部署,提升资源利用率。
GPT Realtime 和 Audio 模型 GA,新增图像输入、异步 Function Calling、对话模式等,语音 Agent 能力全面成熟。
Sora 支持图像到视频生成,可指定图像出现的帧位置。
Sora 支持视频到视频生成,可输入短片生成长视频。
GPT-5-codex 发布,专为 Codex CLI 和 VS Code 扩展设计,面向 Coding Agent 场景。
Azure 内置 PII 检测内容过滤器,可在 LLM 输出中识别并阻止敏感个人信息。
GPT-image-1-mini 全球可用,轻量版图像生成模型,不支持编辑和输入保真度。
Azure 发布说话人分离 ASR 模型 gpt-4o-transcribe-diarize,支持 100+ 语言实时转写并标注说话人。
Realtime API 支持 SIP 协议,可直接接入电话网络,打通语音 Agent 到 PSTN 的最后一步。
TTS 模型升级,多语言合成更自然,改善说话人相似度和减少音频瑕疵。
Realtime-mini 模型在指令遵循和 Function Calling 上达到与完整版持平,语音 Agent 能力下沉到轻量模型。
ASR 模型重大升级:WER 降低约 50%,静音幻觉减少 4 倍,多语言性能提升。
Azure 上线 GPT-image-1.5,提升图像生成质量、编辑控制和面部保留能力,支持高输入保真度编辑。
Azure 发布 GPT-Realtime-1.5 和 GPT-Audio-1.5,提升指令遵循、多语言支持和 Tool Calling 能力。
Azure 发布 Realtime Translate 和 Realtime Whisper 概念文档,覆盖实时翻译和低延迟流式转录场景。
Azure 发布 GPT Realtime 2.0 概念文档,涵盖推理支持、响应分阶段和更严格的指令遵循。
Anthropic Provides Advanced Features Such as Code Execution and Web Search
Anthropic提供了一些高级功能,如代码执行和网络搜索,这些功能可以提高开发者的使用体验。
Anthropic Offers Multiple Pricing Plans for Different User Needs
Anthropic推出了多种定价计划,包括免费、专业版、团队版和企业版,以适应不同的用户需求。
谷歌发布了Gemini for Science,这是一个新的科学工具和实验集合,旨在扩大科学探索的规模和精度。
Break the context window barrier with Amazon Bedrock AgentCore
本文介绍了如何使用Amazon Bedrock AgentCore Code Interpreter和Strands Agents SDK实现递归语言模型(RLM),从而处理任意长度的文档,并利用Bedrock AgentCore Code Interpreter作为持久的工作内存进行迭代文档分析。
Building multi-tenant agents with Amazon Bedrock AgentCore
文章探讨了使用Amazon Bedrock AgentCore构建多租户Agent应用程序的设计考虑因素以及解决SaaS架构挑战所需的框架。
AWS launches frontier agents for security testing and cloud operations
AWS发布了用于安全测试和云操作的前沿Agent,这些自主系统可以独立工作,大规模处理并发任务,并在没有持续人工监督的情况下长时间运行。
亚马逊Bedrock推出了优先级和灵活层级,分别比标准层级价格高75%和低50%。
亚马逊Bedrock为特定基础模型提供比按需推理低50%的批量推理价格。
微软Foundry本地版1.1增加了实时转录、嵌入、Responses API等功能。
微软Foundry推出Toolbox功能,简化了AI代理工具的配置和复用。
微软Foundry在2026年4月发布了一系列新模型(如GPT-5.5、GPT-image-2等)以及新的开发工具和框架。
火山方舟新增了多项多模态理解与生成教程,包括Doubao Seedance 2.0和Seedream 4.0-5.0等。
火山方舟推出了上下文缓存和文件输入新功能,提升了用户体验。
火山方舟更新了多个模型的价格,可能影响市场竞争力。
Kimi API 的 Chat Completion 接口实行按量计费,包括输入输出以及文档抽取。
Kimi 发布了新的多模态模型 K2.6,提升了长程代码编写能力。
Kimi发布了K2.6多模态模型,增强了长程代码编写能力,并支持多种输入类型。
MiniMax 平台的语音资源包支持多模态接口,并赠送快速克隆音色。
MiniMax 平台推出了多个语音资源包套餐,并提供不同程度的折扣优惠。
智谱大模型开放平台提供了多种开发方式,满足不同开发者的需求和技术栈偏好。
智谱大模型开放平台提供了多种多模态模型,支持各种应用场景。
Project Glasswing: An initial update
Project Glasswing 首次进展更新,目前了解的信息有限。
KPMG integrates Claude across its core business and workforce of more than 276,000 in strategic alliance
KPMG 将 Claude 部署至全公司 27.6 万+ 员工,是企业级 AI 大规模落地的标志性案例。
Widening the conversation on frontier AI
Anthropic 推动前沿 AI 公共对话,属安全治理层面的倡议。
Anthropic acquires Stainless
Anthropic 收购 API 基础设施/SDK 工具公司 Stainless,将大幅强化开发者体验和 API 生态。
PwC is deploying Claude to build technology, execute deals, and reinvent enterprise functions for clients
PwC 将 Claude 部署到技术交付和交易执行等核心业务中,面向客户重塑企业功能。