按发生时间倒序排列,最新在前。共 2 条匹配。按重要性筛选用下方「影响」chip。
DeepSeek-V2-0628: Improved Reasoning and Role-Playing
V2-0628 在数学和推理 benchmark 上大幅提升,Arena-Hard 对 GPT-4 胜率接近翻倍,是 V2 时代最重要的能力跃升。
DeepSeek-V2-0517: Instruction Following and JSON Accuracy
V2-0517 重点提升指令遵循和 JSON 输出可靠性,优化了 RAG 和翻译场景的 system prompt 表现。