AI 竞品情报系统

战略视角

战略意图：此前推理模型（R1）不支持 Function Calling，这严重限制了其在 Agent 场景的使用——开发者必须在推理和工具调用之间二选一。R1-0528 补上了这一关键缺口，使推理模型可以直接作为 Agent 的「大脑」。影响面：直接面向需要复杂推理 + 工具调用的 Agent 开发者（如金融分析、代码审查、研究助手），Tau-bench 的两个子项成绩为 Agent 工具调用质量提供了行业基准。赛道占位：推理 + Function Calling 的组合正在成为 Agent 模型的新标准，这对我们的 Agent Runtime 提出了更高要求——我们需要确保托管的推理模型同样具备工具调用能力。窗口期：需立即评估我们平台上的推理模型是否支持 Function Calling，以及 Tau-bench 基准上的对比表现。

一句话摘要

R1 推理模型首次获得 Function Calling 和 JSON 输出能力，推理 benchmark 全面提升，使推理模型可在 Agent 场景中直接使用。

详细描述

deepseek-reasoner upgraded to DeepSeek-R1-0528. Major benchmark improvements: AIME 2025 70.0→87.5, GPQA 71.5→81.0, LCB_v6 63.5→73.3, Aider 57.0→71.6. New features: JSON Output support, Function Calling support. Tau-bench scores: 53.5 (Airline) / 63.9 (Retail). Also optimized front-end development and reduced hallucinations.

reasoner 模型升级至 R1-0528，AIME 2025 提升 17.5 分，新增 JSON 输出和 Function Calling 支持。Tau-bench：53.5（航空）/ 63.9（零售）。前端开发优化，幻觉显著降低。

原文摘录

deepseek-reasoner Model Upgraded to DeepSeek-R1-0528: Enhanced Reasoning Capabilities. JSON Output & Function Calling Support. Function call performance: Tau-bench score: 53.5 (Airline) / 63.9 (Retail).

DeepSeek-R1-0528：推理增强，新增 JSON 输出和 Function Calling

对我们的启示

战略视角

一句话摘要

详细描述

原文摘录