2026-05-23 周报 AI 竞品情报报告

📌 执行摘要

本期情报聚焦于大模型底层能力跃升与 Agent 运行时的实质性演进。海外厂商在 Agent 操控与编程场景持续发力，微软 Azure 推出 GPT-5-Codex 编程专用模型及统一有状态的 Responses API，Anthropic 发布 Claude Opus 4.7 并在企业级市场拿下 KPMG 等头部客户。国内厂商则在多模态与长文本代码生成上加速迭代，DeepSeek 发布 V4 系列并大幅下调缓存命中价格，Kimi 推出 K2.6 增强长程代码能力。整体来看，MaaS 平台的竞争已从单纯的对话生成转向“复杂任务执行”与“企业级合规降本”。我们需要尽快补齐 Agent 计算机操控与有状态 API 能力，在推理服务定价上跟进缓存与批量折扣策略，并加速企业级 PII 检测等合规功能的上线。

🌟 里程碑事件

Anthropic: Introducing Claude Opus 4.7

Anthropic 发布了 Claude Opus 4.7 模型，在代码生成、Agent 任务执行、视觉理解和多步骤复杂任务上的表现更强，且在关键任务中具备更高的彻底性和一致性。这意味着企业开发者在处理长链路自动化任务时，能获得更稳定、更少幻觉的输出结果。
对我们的启示: 要做 — 新模型的发布直接影响我们的核心竞争力，我们应该立即评估接入或对标。

Microsoft Azure AI Foundry: What's new in Microsoft Foundry | April 2026

微软 Foundry 在 4 月集中上线了 GPT-5.5、GPT-image-2、Gemma 4 和 Claude Opus 4.7 等新模型，同时发布了 Foundry Local GA、Microsoft Agent Framework 1.0 GA 以及 VS Code 扩展工具包。这让企业开发者可以在本地和云端无缝切换 Agent 开发环境，并通过统一的 SDK 进行第三方 Agent 的批量评估和链路追踪。
对我们的启示: 要做 — 我们应立即评估并接入这些新模型和工具，以增强我们的MaaS平台竞争力。

Kimi Platform（Moonshot）: Kimi K2.6 正式发布，支持多模态输入和更强的长程代码编写能力

Kimi 发布多模态模型 K2.6，支持视觉与文本输入，并重点提升了长程代码编写能力。开发者现在可以让模型直接阅读 UI 截图或长篇幅的代码仓库，生成更稳定、上下文连贯的代码片段，减少了长文本处理中的代码截断或逻辑遗忘问题。
对我们的启示: 要做 — 新发布的模型直接关系到我们的核心竞争力，我们应该立即评估并接入或对标。

智谱 BigModel: 智谱大模型开放平台提供多种多模态模型

智谱大模型开放平台上线了数十个模型，全面覆盖文本生成、语言推理、图像理解、视频生成和音视频处理。开发者可以通过统一的 API 接口调用不同模态的模型，无需为每种媒体类型单独对接不同的服务商，降低了多模态应用的开发门槛。
对我们的启示: 要做 — 我们应立即评估并接入，以提升我们的多模态处理能力。

DeepSeek Platform: DeepSeek发布V4新模型

DeepSeek 发布 V4-Pro 和 V4-Flash 新模型，同时支持 OpenAI ChatCompletions 接口和 Anthropic 接口。开发者无需修改现有的请求 base_url，只需更改 model 参数即可无缝切换到 V4 模型，大幅降低了迁移成本，且双接口支持让已有海外业务代码的开发者能直接复用。
对我们的启示: 要做 — 新模型家族直接关系到我们MaaS平台的核心竞争力，应立即评估接入或对标。

Microsoft Azure AI Foundry: GPT-5 全系列模型登陆 Azure：包含 GPT-5-Codex 编程专用模型

Azure 上线 GPT-5 全系列模型，其中 GPT-5-Codex 专为编程 Agent 场景设计，配合 Codex CLI 和 VS Code 扩展使用。这让开发者在 IDE 中运行自动化代码重构、复杂 Bug 修复时，能调用专门优化过代码逻辑推理的模型，显著提升代码生成的准确率和执行成功率。
对我们的启示: 要做 — GPT-5-Codex 是 Coding Agent 赛道的里程碑级产品，直接关系到我们 MaaS 平台的 Agent 开发体验和 Coding Agent 能力，必须立即评估对标。

Microsoft Azure AI Foundry: Responses API 和 Computer Use 模型发布：统一有状态 API 和计算机操控能力

Azure OpenAI 发布统一有状态的 Responses API，整合了聊天补全和助手 API 的能力，并推出 computer-use-preview 模型。Agent 现在可以通过 API 直接控制计算机界面（如点击、输入、滚动），结合 Playwright 等工具，开发者可以构建自动操作网页或桌面软件的 Agent，将 AI 能力从“对话”延伸到“实际执行操作”。
对我们的启示: 要做 — Responses API 统一了 API 范式，Computer Use 是 Agent 能力的关键突破。我们 MaaS 平台的 Agent Runtime 必须对标此类能力，否则会在 Agent 操控能力上落后。

❗ 重要更新

Anthropic: KPMG integrates Claude across its core business and workforce of more than 276,000 in strategic alliance

KPMG 与 Anthropic 达成战略合作，将 Claude 集成到其核心业务和超过 27.6 万名员工的日常工作中。这表明头部咨询和审计企业已经认可大模型在企业级复杂数据处理和合规场景下的可靠性，为 MaaS 平台拓展大型 B 端客户提供了明确的落地标杆。
对我们的启示: 要做 — 重大合作伙伴关系直接影响我们的企业客户策略，应立即评估并考虑类似的合作。

Anthropic: Anthropic提供高级功能如代码执行和网络搜索

Anthropic 在 API 中内置了代码执行（沙盒环境运行 Python）和网络搜索功能，并按额外成本计费。开发者无需自己搭建代码沙盒或维护搜索引擎爬虫，直接在 Prompt 中让模型调用这些工具，大幅缩短了带有数据分析和实时信息获取需求的 Agent 开发周期。
对我们的启示: 要做 — Anthropic的高级功能如代码执行、网络搜索等对于开发者和Agent访问体验至关重要，我们应该立即评估并接入类似的功能。

AWS Bedrock: 使用Amazon Bedrock AgentCore打破上下文窗口限制

AWS 介绍了如何使用 Bedrock AgentCore Code Interpreter 和 Strands Agents SDK 实现递归语言模型（RLM）。通过将 Code Interpreter 作为持久工作内存，Agent 可以分块读取并迭代分析任意长度的文档，彻底绕过了模型原生上下文窗口的限制，让处理数百页 PDF 或超大代码库成为可能。
对我们的启示: 要做 — 我们需要跟进此技术，因为它打破了上下文窗口限制，对提升我们的MCP生态有重要影响。

AWS Bedrock: Amazon Bedrock offers 50% discount for batch inference on select foundation models

AWS Bedrock 为 Anthropic、Meta、Mistral 等厂商的特定基础模型提供批量推理（Batch Inference）服务，价格比按需推理低 50%。对于不需要实时响应、主要在夜间或后台跑大批量数据标注、文档摘要的企业客户，这直接将推理成本砍半。
对我们的启示: 要做 — 我们应评估并考虑引入批量推理的折扣策略，以提高竞争力。

Microsoft Azure AI Foundry: PII 检测内容过滤器上线：内置敏感信息识别与阻断

Azure OpenAI 新增内置的 PII（个人身份信息）检测内容过滤器，能自动识别并阻断模型输出中的敏感隐私数据。企业客户在金融、医疗等强监管行业部署 Agent 时，无需再自行开发复杂的正则或外挂过滤服务，开箱即用地满足数据合规要求。
对我们的启示: 要做 — PII 检测是企业级 MaaS 平台安全和合规的基础能力，直接影响企业客户信任度和数据合规采购决策，百炼应尽快具备类似能力。

DeepSeek Platform: 输入缓存命中价格降至发布价格的1/10

DeepSeek 将所有模型的输入缓存命中（Cache Hit）价格降至原发布价格的 1/10。对于在系统提示词（System Prompt）中携带大量背景知识、或在多轮对话中重复输入长文档的开发者，其实际账单成本将大幅下降，极大鼓励了开发者使用长上下文和复杂 Prompt。
对我们的启示: 要做 — 价格调整直接影响我们的竞争力，应立即评估并调整我们的定价策略。

DeepSeek Platform: DeepSeek-V3.1引入混合推理架构

DeepSeek-V3.1 引入混合推理架构，单一模型同时支持思考模式（Thinking）和非思考模式。相比之前的 R1 模型，V3.1 在提供深度推理的同时显著减少了响应时间，并在工具调用和 Agent 任务上取得大幅提升，让开发者能在一个 API 端点下灵活切换“快响应”与“深思考”。
对我们的启示: 要做 — 显著提升了推理效率和工具使用能力，这对我们MaaS平台的核心竞争力至关重要。

火山方舟: 火山方舟更新模型价格

火山方舟更新了平台上多个模型的调用价格。通过价格调整，火山方舟进一步降低了开发者的接入成本，在当前的 MaaS 价格竞争中保持其在国内市场的性价比优势。
对我们的启示: 要做 — 火山方舟调整了模型价格，我们应立即评估并考虑对标调整以保持竞争力。

🎯 行动建议

行动 1: 加速引入前沿大模型与编程专用模型。我们需要在 2 周内完成对 Claude Opus 4.7、GPT-5-Codex、DeepSeek V4 以及 Kimi K2.6 等最新模型的横向评测与接入评估。特别是针对 GPT-5-Codex 这类专为编程 Agent 优化的模型，需明确当前在代码生成和长程代码重构场景下的能力差距，并尽快补齐专属编程模型的供给，以满足开发者对高质量代码 Agent 的需求。
行动 2: 升级 Agent Runtime 与有状态 API 能力。我们需要立即启动对 Responses API 和 Computer Use 能力的对标研发。当前的 Agent 开发正从单纯的文本对话向真实的计算机界面操控演进，我们必须提供统一的有状态 API 来简化多步任务的管理，并内置计算机操控模型支持，让开发者能够构建自动执行网页或桌面操作的复杂 Agent，避免在 Agent 核心运行能力上落后于海外竞品。
行动 3: 完善企业级安全合规与高级内置工具。我们需要尽快上线 PII（个人身份信息）检测内容过滤器，并内置代码执行沙盒与网络搜索功能。PII 检测是金融、医疗等企业客户采购 MaaS 服务的合规底线，而内置的代码执行和搜索工具能大幅减少开发者自行搭建外挂组件的成本。这些能力的补齐将直接提升我们在企业级市场和复杂 Agent 开发场景中的转化率。
行动 4: 优化推理服务定价与弹性折扣策略。我们需要重新审视当前的计费模型，重点跟进输入缓存命中降价、批量推理折扣以及分层定价策略。将缓存命中价格大幅下调可以鼓励开发者使用长上下文和复杂系统提示词；推出批量推理 50% 折扣能吸引对延迟不敏感的后台数据处理客户；结合优先级与灵活层级的分层定价，则能更好地满足企业对成本与 SLA 的不同诉求，从而在激烈的价格竞争中保持优势。

📊 数据来源

本期共 36 条情报
覆盖厂商: Anthropic, Microsoft Azure AI Foundry, Kimi Platform（Moonshot）, 智谱 BigModel, DeepSeek Platform, Google (Gemini / Vertex / Agent Enterprise), AWS Bedrock, 火山方舟, MiniMax Platform
时间范围: 2026-05-17 ~ 2026-05-23