按发生时间倒序排列,最新在前。共 49 条匹配。按重要性筛选用下方「影响」chip。
Realtime API 支持 WebRTC,实现浏览器端实时音频流和低延迟语音交互。
Sora 视频生成模型在 Azure 上预览发布,支持文本到视频生成。
codex-mini 和 o3-pro 两款新推理模型发布,丰富推理模型产品矩阵。
Provisioned spillover 正式 GA,预留实例超限流量自动溢出到标准部署,提升资源利用率。
GPT-5-codex 发布,专为 Codex CLI 和 VS Code 扩展设计,面向 Coding Agent 场景。
Azure 内置 PII 检测内容过滤器,可在 LLM 输出中识别并阻止敏感个人信息。
Azure 发布说话人分离 ASR 模型 gpt-4o-transcribe-diarize,支持 100+ 语言实时转写并标注说话人。
Realtime API 支持 SIP 协议,可直接接入电话网络,打通语音 Agent 到 PSTN 的最后一步。
Realtime-mini 模型在指令遵循和 Function Calling 上达到与完整版持平,语音 Agent 能力下沉到轻量模型。
ASR 模型重大升级:WER 降低约 50%,静音幻觉减少 4 倍,多语言性能提升。
Azure 上线 GPT-image-1.5,提升图像生成质量、编辑控制和面部保留能力,支持高输入保真度编辑。
Azure 发布 GPT-Realtime-1.5 和 GPT-Audio-1.5,提升指令遵循、多语言支持和 Tool Calling 能力。
Anthropic Provides Advanced Features Such as Code Execution and Web Search
Anthropic提供了一些高级功能,如代码执行和网络搜索,这些功能可以提高开发者的使用体验。
Anthropic Offers Multiple Pricing Plans for Different User Needs
Anthropic推出了多种定价计划,包括免费、专业版、团队版和企业版,以适应不同的用户需求。
谷歌发布了Gemini for Science,这是一个新的科学工具和实验集合,旨在扩大科学探索的规模和精度。
Break the context window barrier with Amazon Bedrock AgentCore
本文介绍了如何使用Amazon Bedrock AgentCore Code Interpreter和Strands Agents SDK实现递归语言模型(RLM),从而处理任意长度的文档,并利用Bedrock AgentCore Code Interpreter作为持久的工作内存进行迭代文档分析。
AWS launches frontier agents for security testing and cloud operations
AWS发布了用于安全测试和云操作的前沿Agent,这些自主系统可以独立工作,大规模处理并发任务,并在没有持续人工监督的情况下长时间运行。
亚马逊Bedrock推出了优先级和灵活层级,分别比标准层级价格高75%和低50%。
亚马逊Bedrock为特定基础模型提供比按需推理低50%的批量推理价格。
微软Foundry本地版1.1增加了实时转录、嵌入、Responses API等功能。
微软Foundry推出Toolbox功能,简化了AI代理工具的配置和复用。
火山方舟新增了多项多模态理解与生成教程,包括Doubao Seedance 2.0和Seedream 4.0-5.0等。
火山方舟推出了上下文缓存和文件输入新功能,提升了用户体验。
火山方舟更新了多个模型的价格,可能影响市场竞争力。
Kimi API 的 Chat Completion 接口实行按量计费,包括输入输出以及文档抽取。
Kimi发布了K2.6多模态模型,增强了长程代码编写能力,并支持多种输入类型。
MiniMax 平台的语音资源包支持多模态接口,并赠送快速克隆音色。
MiniMax 平台推出了多个语音资源包套餐,并提供不同程度的折扣优惠。
智谱大模型开放平台提供了多种开发方式,满足不同开发者的需求和技术栈偏好。
KPMG integrates Claude across its core business and workforce of more than 276,000 in strategic alliance
KPMG 将 Claude 部署至全公司 27.6 万+ 员工,是企业级 AI 大规模落地的标志性案例。
Anthropic forms $200 million partnership with the Gates Foundation
Anthropic 获盖茨基金会 2 亿美元合作,可能用于 AI 在公益/健康/教育等领域的应用。
PwC is deploying Claude to build technology, execute deals, and reinvent enterprise functions for clients
PwC 将 Claude 部署到技术交付和交易执行等核心业务中,面向客户重塑企业功能。
Introducing Claude for Small Business
Anthropic 推出面向中小企业的 Claude 方案,扩展企业覆盖范围至 SMB 市场。
Higher usage limits for Claude and a compute deal with SpaceX
Anthropic 提升 Claude 使用上限并与 SpaceX 达成算力合作,暗示推理基础设施扩张。
Agents for financial services
Anthropic 推出金融服务业专用 Agent 方案,垂直行业 Agent 化趋势加速。
Input Cache Hit Price Reduced to 1/10 of Launch Price
DeepSeek Platform将所有模型的输入缓存命中价格降至发布价格的1/10。
Introducing Claude Design by Anthropic Labs
Anthropic 推出 Labs 实验产品 Claude Design,支持 AI 辅助视觉创作(设计/原型/PPT 等)。
What 81,000 people want from AI - Large-scale qualitative study
Anthropic 发布 8.1 万人参与的 AI 用户研究,是最大规模多语言定性调研,揭示用户对 AI 的真实态度。
Claude is a space to think - Ad-free commitment
Anthropic 承诺 Claude 永不加广告,通过订阅模式而非广告变现,强化用户信任定位。
DeepSeek-V3.2 Upgrade
DeepSeek-V3.2 发布,统一 chat 和 reasoner 两条模型线到 V3.2 架构下。
DeepSeek-V3.1-Terminus: Fixes for Language Mixing and Agent Optimization
V3.1 的小版本升级,重点修复语言混用问题并强化 Coding Agent 和搜索 Agent,显示 DeepSeek 在 Agent 场景的持续投入。
DeepSeek-R1-0528: Enhanced Reasoning, JSON Output, and Function Calling
R1 推理模型首次获得 Function Calling 和 JSON 输出能力,推理 benchmark 全面提升,使推理模型可在 Agent 场景中直接使用。
DeepSeek-V3-0324: Enhanced Reasoning, Front-End Dev, and Function Calling
V3-0324 在推理 benchmark 上全面提升,修复了此前 V3 版本的 Function Calling 问题,中文写作对齐 R1 风格。
DeepSeek V2.5: Merger of Chat and Coder Models
DeepSeek 将 Chat 和 Coder 两条模型线合并为统一的 V2.5,简化产品线同时保持 API 兼容,是模型统合战略的早期信号。
Context Caching on Disk Technology
DeepSeek 推出基于硬盘的上下文缓存技术,通过降低缓存存储成本实现大幅降价,是推理成本优化的创新方案。
New API Features: JSON Mode, Function Calling, FIM Completion
DeepSeek API 补全了 JSON Mode、Function Calling 等关键开发者功能,并新增 FIM Completion,标志其 API 能力向 OpenAI 看齐。
DeepSeek-V2-0628: Improved Reasoning and Role-Playing
V2-0628 在数学和推理 benchmark 上大幅提升,Arena-Hard 对 GPT-4 胜率接近翻倍,是 V2 时代最重要的能力跃升。
DeepSeek-Coder-V2-0614: GPT-4-Turbo Level Coding
DeepSeek Coder V2 首次宣称代码能力对标 GPT-4-Turbo,同时具备通用能力,是 DeepSeek 在 Coding 赛道的关键突破。
DeepSeek-V2-0517: Instruction Following and JSON Accuracy
V2-0517 重点提升指令遵循和 JSON 输出可靠性,优化了 RAG 和翻译场景的 system prompt 表现。