时间线

按发生时间倒序排列，最新在前。共 54 条匹配。按重要性筛选用下方「影响」chip。

里程碑行业级事件（新模型家族 / 新平台范式 / 重大降价）重要核心能力增强 / 价格调整 / 重要合作常规小修小补 / 文档更新

Anthropic重要其他newsAgent Runtime安全2026-03-18

8.1 万人对 AI 的期望 — 大规模定性研究

What 81,000 people want from AI - Large-scale qualitative study

Anthropic 发布 8.1 万人参与的 AI 用户研究，是最大规模多语言定性调研，揭示用户对 AI 的真实态度。

💡

可借鉴：该研究发现可为我们的产品定位和用户需求洞察提供输入，特别是 Prosumer 群体对 AI 的核心期望和恐惧。

Google (Gemini / Vertex / Agent Enterprise)重要新发布blog推理效果提升2026-03-17

迈向 AGI 的进展度量：一个认知框架

Measuring progress toward AGI: A cognitive framework

DeepMind 发布 AGI 评估认知框架并举办 Kaggle 基准测试黑客马拉松，体现其在 AI 评估标准上的话语权争夺。

💡

可借鉴：AGI 评估框架和基准测试建设是行业标准话语权之争，可关注其框架对推理/Agent 能力的评估维度，用于指导我们模型评测体系。

Anthropic重要其他news订阅模式2026-02-04

Claude 承诺永不加广告

Claude is a space to think - Ad-free commitment

Anthropic 承诺 Claude 永不加广告，通过订阅模式而非广告变现，强化用户信任定位。

💡

可借鉴：广告策略选择影响商业模式定位，Anthropic 的订阅制路线验证了 Prosumer 市场付费意愿，我们可借鉴其信任建设叙事。

Google (Gemini / Vertex / Agent Enterprise)重要新发布blog多模态订阅模式2026-01-29

Project Genie：面向美国 AI Ultra 用户开放的无限交互世界

Project Genie: Experimenting with infinite, interactive worlds

Project Genie 作为世界模型产品向付费用户开放，展示 Google 在多模态/世界模型方向的产品化进展。

💡

可借鉴：世界模型是前沿方向但非 MaaS 平台主线，可关注其作为「AI 订阅增值服务」的商业模式，以及世界模型 API 化的可能性。

DeepSeek Platform重要新发布changelog推理效果提升2025-12-01

DeepSeek-V3.2 升级

DeepSeek-V3.2 Upgrade

DeepSeek-V3.2 发布，统一 chat 和 reasoner 两条模型线到 V3.2 架构下。

💡

可借鉴：已有模型的迭代升级，V4 已经发布后这条历史记录价值降低，但统一思维/非思维模式的架构思路值得参考。

DeepSeek Platform重要能力增强changelog效果提升Coding AgentAgent Runtime2025-09-22

DeepSeek-V3.1-Terminus：修复语言混用并优化 Agent 能力

DeepSeek-V3.1-Terminus: Fixes for Language Mixing and Agent Optimization

V3.1 的小版本升级，重点修复语言混用问题并强化 Coding Agent 和搜索 Agent，显示 DeepSeek 在 Agent 场景的持续投入。

💡

要做：Code Agent 和 Search Agent 的性能优化直接对标我们的 Agent Runtime 主线，语言一致性修复对中文开发者体验至关重要，我们应关注其对标水平。

DeepSeek Platform重要能力增强changelog推理效果提升Tool UseFunction Calling2025-05-28

DeepSeek-R1-0528：推理增强，新增 JSON 输出和 Function Calling

DeepSeek-R1-0528: Enhanced Reasoning, JSON Output, and Function Calling

R1 推理模型首次获得 Function Calling 和 JSON 输出能力，推理 benchmark 全面提升，使推理模型可在 Agent 场景中直接使用。

💡

要做：推理模型加入 Function Calling 是关键能力补全——推理+工具调用的组合是 Agent 核心需求，Tau-bench 成绩为我们提供了对标基准。

DeepSeek Platform重要能力增强changelog推理效果提升Function Calling2025-03-24

DeepSeek-V3-0324：推理增强，前端开发和 Function Calling 改进

DeepSeek-V3-0324: Enhanced Reasoning, Front-End Dev, and Function Calling

V3-0324 在推理 benchmark 上全面提升，修复了此前 V3 版本的 Function Calling 问题，中文写作对齐 R1 风格。

💡

可借鉴：V3 系列的重要迭代，Function Calling 修复和中文写作优化对我们中文开发者场景有参考价值，但已被后续版本超越。

DeepSeek Platform重要新发布changelog效果提升Coding Agent2024-09-05

DeepSeek V2.5：Chat 和 Coder 模型合并

DeepSeek V2.5: Merger of Chat and Coder Models

DeepSeek 将 Chat 和 Coder 两条模型线合并为统一的 V2.5，简化产品线同时保持 API 兼容，是模型统合战略的早期信号。

💡

可借鉴：Chat/Coder 合并策略体现「通用+代码」一体化的产品思路，与我们是否应维护独立 Coding 模型或统一模型的决策相关。

DeepSeek Platform重要能力增强changelog长上下文低延迟降价2024-08-02

上下文硬盘缓存技术上线

Context Caching on Disk Technology

DeepSeek 推出基于硬盘的上下文缓存技术，通过降低缓存存储成本实现大幅降价，是推理成本优化的创新方案。

💡

要做：上下文缓存是长上下文推理降本的核心技术，硬盘缓存方案可能改变成本结构，直接影响我们 Token Plan 和推理服务的定价竞争力。

第 41–50 条 / 共 54 条

每页10 20 50