AI 竞品情报
线上 · resumization.cn
← 时间线|DeepSeek Platform 全部动态 →
DeepSeek Platform重要能力增强changelog发生于 2025-05-28

DeepSeek-R1-0528:推理增强,新增 JSON 输出和 Function Calling

DeepSeek-R1-0528: Enhanced Reasoning, JSON Output, and Function Calling

https://api-docs.deepseek.com/updates

对我们的启示

💡
要做推理模型加入 Function Calling 是关键能力补全——推理+工具调用的组合是 Agent 核心需求,Tau-bench 成绩为我们提供了对标基准。

战略视角

战略意图:此前推理模型(R1)不支持 Function Calling,这严重限制了其在 Agent 场景的使用——开发者必须在推理和工具调用之间二选一。R1-0528 补上了这一关键缺口,使推理模型可以直接作为 Agent 的「大脑」。影响面:直接面向需要复杂推理 + 工具调用的 Agent 开发者(如金融分析、代码审查、研究助手),Tau-bench 的两个子项成绩为 Agent 工具调用质量提供了行业基准。赛道占位:推理 + Function Calling 的组合正在成为 Agent 模型的新标准,这对我们的 Agent Runtime 提出了更高要求——我们需要确保托管的推理模型同样具备工具调用能力。窗口期:需立即评估我们平台上的推理模型是否支持 Function Calling,以及 Tau-bench 基准上的对比表现。

一句话摘要

R1 推理模型首次获得 Function Calling 和 JSON 输出能力,推理 benchmark 全面提升,使推理模型可在 Agent 场景中直接使用。

详细描述

deepseek-reasoner upgraded to DeepSeek-R1-0528. Major benchmark improvements: AIME 2025 70.0→87.5, GPQA 71.5→81.0, LCB_v6 63.5→73.3, Aider 57.0→71.6. New features: JSON Output support, Function Calling support. Tau-bench scores: 53.5 (Airline) / 63.9 (Retail). Also optimized front-end development and reduced hallucinations.

reasoner 模型升级至 R1-0528,AIME 2025 提升 17.5 分,新增 JSON 输出和 Function Calling 支持。Tau-bench:53.5(航空)/ 63.9(零售)。前端开发优化,幻觉显著降低。

原文摘录

deepseek-reasoner Model Upgraded to DeepSeek-R1-0528: Enhanced Reasoning Capabilities. JSON Output & Function Calling Support. Function call performance: Tau-bench score: 53.5 (Airline) / 63.9 (Retail).