AI 竞品情报
线上 · resumization.cn
← 时间线|DeepSeek Platform 全部动态 →
DeepSeek Platform重要能力增强changelog发生于 2025-03-24

DeepSeek-V3-0324:推理增强,前端开发和 Function Calling 改进

DeepSeek-V3-0324: Enhanced Reasoning, Front-End Dev, and Function Calling

https://api-docs.deepseek.com/updates

对我们的启示

💡
可借鉴V3 系列的重要迭代,Function Calling 修复和中文写作优化对我们中文开发者场景有参考价值,但已被后续版本超越。

战略视角

战略意图:此次更新在修复 V3 早期版本的 Function Calling 缺陷(这曾是开发者的常见抱怨),同时将 R1 的中文写作风格能力回灌到非推理模型,体现了模型间能力迁移的策略。影响面:中文开发者和内容创作类应用直接受益于写作质量提升。赛道占位:Function Calling 可靠性是 Agent 落地的关键前提,DeepSeek 公开承认并修复 V3 的 Function Calling 问题,说明这一能力已成兵家必争之地。窗口期:作为历史记录参考,关注 Function Calling 准确性的持续改进路径。

一句话摘要

V3-0324 在推理 benchmark 上全面提升,修复了此前 V3 版本的 Function Calling 问题,中文写作对齐 R1 风格。

详细描述

deepseek-chat upgraded to DeepSeek-V3-0324. Benchmark improvements: MMLU-Pro 75.9→81.2, GPQA 59.1→68.4, AIME 39.6→59.4, LiveCodeBench 39.2→49.2. Improved front-end web development, Chinese writing aligned with R1 style, enhanced Function Calling accuracy.

deepseek-chat 升级至 V3-0324,MMLU-Pro 提升至 81.2,AIME 提升 19.8 分。前端开发、中文写作对齐 R1 风格,Function Calling 准确性提高。

原文摘录

MMLU-Pro: 75.9 → 81.2 (+5.3), GPQA: 59.1 → 68.4 (+9.3), AIME: 39.6 → 59.4 (+19.8), LiveCodeBench: 39.2 → 49.2 (+10.0). Function Calling Improvements: Increased accuracy in Function Calling, fixing issues from previous V3 versions.