AI 竞品情报系统

战略视角

战略意图：此次更新在修复 V3 早期版本的 Function Calling 缺陷（这曾是开发者的常见抱怨），同时将 R1 的中文写作风格能力回灌到非推理模型，体现了模型间能力迁移的策略。影响面：中文开发者和内容创作类应用直接受益于写作质量提升。赛道占位：Function Calling 可靠性是 Agent 落地的关键前提，DeepSeek 公开承认并修复 V3 的 Function Calling 问题，说明这一能力已成兵家必争之地。窗口期：作为历史记录参考，关注 Function Calling 准确性的持续改进路径。

一句话摘要

V3-0324 在推理 benchmark 上全面提升，修复了此前 V3 版本的 Function Calling 问题，中文写作对齐 R1 风格。

详细描述

deepseek-chat upgraded to DeepSeek-V3-0324. Benchmark improvements: MMLU-Pro 75.9→81.2, GPQA 59.1→68.4, AIME 39.6→59.4, LiveCodeBench 39.2→49.2. Improved front-end web development, Chinese writing aligned with R1 style, enhanced Function Calling accuracy.

deepseek-chat 升级至 V3-0324，MMLU-Pro 提升至 81.2，AIME 提升 19.8 分。前端开发、中文写作对齐 R1 风格，Function Calling 准确性提高。

原文摘录

MMLU-Pro: 75.9 → 81.2 (+5.3), GPQA: 59.1 → 68.4 (+9.3), AIME: 39.6 → 59.4 (+19.8), LiveCodeBench: 39.2 → 49.2 (+10.0). Function Calling Improvements: Increased accuracy in Function Calling, fixing issues from previous V3 versions.

DeepSeek-V3-0324：推理增强，前端开发和 Function Calling 改进

对我们的启示

战略视角

一句话摘要

详细描述

原文摘录