时间线

本文介绍了如何使用Amazon Bedrock AgentCore Code Interpreter和Strands Agents SDK实现递归语言模型（RLM），从而处理任意长度的文档，并利用Bedrock AgentCore Code Interpreter作为持久的工作内存进行迭代文档分析。

💡

要做：我们需要跟进此技术，因为它打破了上下文窗口限制，对提升我们的MCP生态有重要影响。

AWS Bedrock重要新发布blogTool UseFunction CallingAgent Runtime~2026-05-23

AWS发布用于安全测试和云操作的前沿Agent

AWS launches frontier agents for security testing and cloud operations

AWS发布了用于安全测试和云操作的前沿Agent，这些自主系统可以独立工作，大规模处理并发任务，并在没有持续人工监督的情况下长时间运行。

💡

要做：我们应评估并接入类似的安全测试和云操作Agent，以增强我们的MaaS平台功能。

AWS Bedrock重要价格变动pricing~2026-05-23

Introduction of Priority and Flex Tiers with Premium and Discount Pricing

亚马逊Bedrock推出了优先级和灵活层级，分别比标准层级价格高75%和低50%。

💡

要做：我们应该评估并考虑引入类似的分层定价策略，以满足不同客户的需求

AWS Bedrock重要价格变动pricing~2026-05-23

Amazon Bedrock offers 50% discount for batch inference on select foundation models

亚马逊Bedrock为特定基础模型提供比按需推理低50%的批量推理价格。

💡

要做：我们应评估并考虑引入批量推理的折扣策略，以提高竞争力

Microsoft Azure AI Foundry重要新发布blog~2026-05-23

Foundry Local 1.1: Live Transcription, Embeddings, and Responses API

微软Foundry本地版1.1增加了实时转录、嵌入、Responses API等功能。

💡

要做：我们需要评估这些新功能，并考虑如何在我们的平台上提供类似的能力。

Microsoft Azure AI Foundry重要能力增强blog~2026-05-23

Introducing Toolboxes in Foundry

微软Foundry推出Toolbox功能，简化了AI代理工具的配置和复用。

💡

可借鉴：思路有价值，可作为产品迭代输入，但当下不必紧跟。

火山方舟重要新发布docs多模态~2026-05-23

火山方舟新增多模态理解和生成教程

火山方舟新增了多项多模态理解与生成教程，包括Doubao Seedance 2.0和Seedream 4.0-5.0等。

💡

要做：火山方舟推出了新的多模态理解和生成功能，这直接影响我们的MaaS平台竞争力，应立即评估接入或对标。

火山方舟重要能力增强pricing~2026-05-23

火山方舟推出上下文缓存和文件输入功能

火山方舟推出了上下文缓存和文件输入新功能，提升了用户体验。

💡

可借鉴：火山方舟提供了新的上下文缓存功能，这对我们未来的产品迭代是一个有价值的参考点

火山方舟重要价格变动pricing~2026-05-23

火山方舟更新模型价格

火山方舟更新了多个模型的价格，可能影响市场竞争力。

💡

要做：火山方舟调整了模型价格，我们应立即评估并考虑对标调整以保持竞争力

Kimi Platform（Moonshot）重要价格变动pricing~2026-05-23

Kimi API 更新计费逻辑，对 Chat Completion 接口实行按量计费

Kimi API 的 Chat Completion 接口实行按量计费，包括输入输出以及文档抽取。

💡

可借鉴：了解竞品的价格策略对我们有参考价值，但不需立刻调整自身价格。

Kimi Platform（Moonshot）重要新发布docs~2026-05-23

Kimi K2.6 模型已正式发布

Kimi发布了K2.6多模态模型，增强了长程代码编写能力，并支持多种输入类型。

💡

要做：新模型的发布直接影响我们的核心竞争力，我们应该立即评估并考虑接入或对标。

MiniMax Platform重要能力增强pricing多模态Tool Use~2026-05-23

MiniMax 平台的语音资源包支持多模态接口并赠送快速克隆音色

MiniMax 平台的语音资源包支持多模态接口，并赠送快速克隆音色。

💡

要做：支持多模态模型和快速克隆音色是增强开发者体验的重要功能，我们应该考虑跟进。

MiniMax Platform重要价格变动pricingToken Plan~2026-05-23

MiniMax 平台推出多种语音资源包套餐及折扣优惠

MiniMax 平台推出了多个语音资源包套餐，并提供不同程度的折扣优惠。

💡

可借鉴：MiniMax 提供了多种套餐和折扣，我们已有类似的定价策略，但可以参考其细节进行优化。

智谱 BigModel重要能力增强blog~2026-05-23

智谱大模型开放平台提供多种开发方式

智谱大模型开放平台提供了多种开发方式，满足不同开发者的需求和技术栈偏好。

💡

要做：我们应立即跟进，以提升我们的开发工具包和SDK的竞争力

Anthropic重要合作newsSLA安全合规2026-05-19

KPMG 与 Anthropic 达成战略联盟，Claude 覆盖 27.6 万员工

KPMG integrates Claude across its core business and workforce of more than 276,000 in strategic alliance

KPMG 将 Claude 部署至全公司 27.6 万+ 员工，是企业级 AI 大规模落地的标志性案例。

💡

可借鉴：KPMG 大规模部署案例验证了 Claude 在企业级场景的落地能力，我们应研究其部署模式以优化自身企业服务方案。

Anthropic重要合作news合作伙伴2026-05-14

Anthropic 与盖茨基金会达成 2 亿美元合作

Anthropic forms $200 million partnership with the Gates Foundation

Anthropic 获盖茨基金会 2 亿美元合作，可能用于 AI 在公益/健康/教育等领域的应用。

💡

暂不跟进：该合作聚焦公益/全球健康领域，与 MaaS 平台 Prosumer/Agent 主线关联度低，暂不跟进。

Anthropic重要合作news安全合规合作伙伴2026-05-14

PwC 部署 Claude 用于技术构建、交易执行和企业功能重塑

PwC is deploying Claude to build technology, execute deals, and reinvent enterprise functions for clients

PwC 将 Claude 部署到技术交付和交易执行等核心业务中，面向客户重塑企业功能。

💡

可借鉴：继 KPMG 后又一四大会计师事务所大规模采用 Claude，进一步验证企业级 AI 采纳趋势，我们应持续关注企业级服务模式。

Anthropic重要新发布newsToken Plan订阅模式2026-05-13

Anthropic 推出 Claude for Small Business

Introducing Claude for Small Business

Anthropic 推出面向中小企业的 Claude 方案，扩展企业覆盖范围至 SMB 市场。

💡

可借鉴：SMB 市场是我们 MaaS 平台可能拓展的方向，需研究 Claude for Small Business 的定价模式和功能裁剪策略。

Anthropic重要能力增强news低延迟免费额度新基建2026-05-06

Claude 用量上限提升及与 SpaceX 计算合作

Higher usage limits for Claude and a compute deal with SpaceX

Anthropic 提升 Claude 使用上限并与 SpaceX 达成算力合作，暗示推理基础设施扩张。

💡

可借鉴：用量上限提升直接影响开发者体验，SpaceX 算力合作暗示 Anthropic 在推理基础设施上的创新，值得关注其对吞吐量和延迟的影响。

Anthropic重要新发布newsTool UseFunction CallingAgent Runtime安全2026-05-05

面向金融服务业的 Agent 方案

Agents for financial services

Anthropic 推出金融服务业专用 Agent 方案，垂直行业 Agent 化趋势加速。

💡

要做：垂直行业 Agent 是我们 Agent Runtime 的重要落地场景，金融服务业 Agent 方案是标杆范例，应立即研究其架构和合规设计。

DeepSeek Platform重要价格变动pricing2026-04-26

输入缓存命中价格降至发布价格的1/10

Input Cache Hit Price Reduced to 1/10 of Launch Price

DeepSeek Platform将所有模型的输入缓存命中价格降至发布价格的1/10。

💡

要做：价格调整直接影响我们的竞争力，应立即评估并调整我们的定价策略。

Anthropic重要新发布news多模态Computer UsePlayground2026-04-17

Anthropic Labs 推出 Claude Design

Introducing Claude Design by Anthropic Labs

Anthropic 推出 Labs 实验产品 Claude Design，支持 AI 辅助视觉创作（设计/原型/PPT 等）。

💡

可借鉴：Claude Design 是面向终端用户的设计工具而非开发者平台能力，但多模态生成+协作的设计范式可借鉴到我们的 Playground 体验设计。

Anthropic重要其他newsAgent Runtime安全2026-03-18

8.1 万人对 AI 的期望 — 大规模定性研究

What 81,000 people want from AI - Large-scale qualitative study

Anthropic 发布 8.1 万人参与的 AI 用户研究，是最大规模多语言定性调研，揭示用户对 AI 的真实态度。

💡

可借鉴：该研究发现可为我们的产品定位和用户需求洞察提供输入，特别是 Prosumer 群体对 AI 的核心期望和恐惧。

Anthropic重要其他news订阅模式2026-02-04

Claude 承诺永不加广告

Claude is a space to think - Ad-free commitment

Anthropic 承诺 Claude 永不加广告，通过订阅模式而非广告变现，强化用户信任定位。

💡

可借鉴：广告策略选择影响商业模式定位，Anthropic 的订阅制路线验证了 Prosumer 市场付费意愿，我们可借鉴其信任建设叙事。

DeepSeek Platform重要新发布changelog推理效果提升2025-12-01

DeepSeek-V3.2 升级

DeepSeek-V3.2 Upgrade

DeepSeek-V3.2 发布，统一 chat 和 reasoner 两条模型线到 V3.2 架构下。

💡

可借鉴：已有模型的迭代升级，V4 已经发布后这条历史记录价值降低，但统一思维/非思维模式的架构思路值得参考。

DeepSeek Platform重要能力增强changelog效果提升Coding AgentAgent Runtime2025-09-22

DeepSeek-V3.1-Terminus：修复语言混用并优化 Agent 能力

DeepSeek-V3.1-Terminus: Fixes for Language Mixing and Agent Optimization

V3.1 的小版本升级，重点修复语言混用问题并强化 Coding Agent 和搜索 Agent，显示 DeepSeek 在 Agent 场景的持续投入。

💡

要做：Code Agent 和 Search Agent 的性能优化直接对标我们的 Agent Runtime 主线，语言一致性修复对中文开发者体验至关重要，我们应关注其对标水平。

DeepSeek Platform重要能力增强changelog推理效果提升Tool UseFunction Calling2025-05-28

DeepSeek-R1-0528：推理增强，新增 JSON 输出和 Function Calling

DeepSeek-R1-0528: Enhanced Reasoning, JSON Output, and Function Calling

R1 推理模型首次获得 Function Calling 和 JSON 输出能力，推理 benchmark 全面提升，使推理模型可在 Agent 场景中直接使用。

💡

要做：推理模型加入 Function Calling 是关键能力补全——推理+工具调用的组合是 Agent 核心需求，Tau-bench 成绩为我们提供了对标基准。

DeepSeek Platform重要能力增强changelog推理效果提升Function Calling2025-03-24

DeepSeek-V3-0324：推理增强，前端开发和 Function Calling 改进

DeepSeek-V3-0324: Enhanced Reasoning, Front-End Dev, and Function Calling

V3-0324 在推理 benchmark 上全面提升，修复了此前 V3 版本的 Function Calling 问题，中文写作对齐 R1 风格。

💡

可借鉴：V3 系列的重要迭代，Function Calling 修复和中文写作优化对我们中文开发者场景有参考价值，但已被后续版本超越。

DeepSeek Platform重要新发布changelog效果提升Coding Agent2024-09-05

DeepSeek V2.5：Chat 和 Coder 模型合并

DeepSeek V2.5: Merger of Chat and Coder Models

DeepSeek 将 Chat 和 Coder 两条模型线合并为统一的 V2.5，简化产品线同时保持 API 兼容，是模型统合战略的早期信号。

💡

可借鉴：Chat/Coder 合并策略体现「通用+代码」一体化的产品思路，与我们是否应维护独立 Coding 模型或统一模型的决策相关。

DeepSeek Platform重要能力增强changelog长上下文低延迟降价2024-08-02

上下文硬盘缓存技术上线

Context Caching on Disk Technology

DeepSeek 推出基于硬盘的上下文缓存技术，通过降低缓存存储成本实现大幅降价，是推理成本优化的创新方案。

💡

要做：上下文缓存是长上下文推理降本的核心技术，硬盘缓存方案可能改变成本结构，直接影响我们 Token Plan 和推理服务的定价竞争力。

DeepSeek Platform重要新发布changelogFunction CallingCoding AgentSDK2024-07-25

新 API 功能：JSON Mode、Function Calling、FIM Completion

New API Features: JSON Mode, Function Calling, FIM Completion

DeepSeek API 补全了 JSON Mode、Function Calling 等关键开发者功能，并新增 FIM Completion，标志其 API 能力向 OpenAI 看齐。

💡

可借鉴：这些已是行业标配能力，但 FIM Completion 对代码补全场景有独特价值，我们可评估是否在平台中提供类似能力。

DeepSeek Platform重要能力增强changelog推理效果提升2024-06-28

DeepSeek-V2-0628：推理和角色扮演能力提升

DeepSeek-V2-0628: Improved Reasoning and Role-Playing

V2-0628 在数学和推理 benchmark 上大幅提升，Arena-Hard 对 GPT-4 胜率接近翻倍，是 V2 时代最重要的能力跃升。

💡

暂不跟进：V2 时代的版本，已被后续版本完全超越，纯历史记录。

DeepSeek Platform重要新发布changelog效果提升Coding Agent2024-06-14

DeepSeek-Coder-V2-0614：代码能力达 GPT-4-Turbo 水平

DeepSeek-Coder-V2-0614: GPT-4-Turbo Level Coding

DeepSeek Coder V2 首次宣称代码能力对标 GPT-4-Turbo，同时具备通用能力，是 DeepSeek 在 Coding 赛道的关键突破。

💡

可借鉴：DeepSeek 在 Coding 赛道的里程碑事件，宣称对标 GPT-4-Turbo 级代码能力，对我们评估 Coding Agent 模型选型有参考意义。

DeepSeek Platform重要能力增强changelog效果提升2024-05-17

DeepSeek-V2-0517：指令遵循和 JSON 准确性提升

DeepSeek-V2-0517: Instruction Following and JSON Accuracy

V2-0517 重点提升指令遵循和 JSON 输出可靠性，优化了 RAG 和翻译场景的 system prompt 表现。

💡

暂不跟进：V2 早期版本，能力已被后续版本大幅超越，纯历史记录。

第 1–49 条 / 共 49 条

每页10 20 50