AI 竞品情报
线上 · resumization.cn
← 时间线|DeepSeek Platform 全部动态 →
DeepSeek Platform重要能力增强changelog发生于 2024-08-02

上下文硬盘缓存技术上线

Context Caching on Disk Technology

https://api-docs.deepseek.com/updates

对我们的启示

💡
要做上下文缓存是长上下文推理降本的核心技术,硬盘缓存方案可能改变成本结构,直接影响我们 Token Plan 和推理服务的定价竞争力。

战略视角

战略意图:上下文缓存是降低重复推理成本的关键技术(类似 Claude 的 prompt caching),但 DeepSeek 采用硬盘而非内存缓存,进一步压缩了存储成本,使其缓存定价可以做到更低。影响面:直接惠及大量重复使用相同 system prompt 或上下文的开发者(如客服 Agent、RAG 应用),降低其 API 调用成本。赛道占位:缓存技术的成本优势直接影响 Token Plan 定价空间——如果竞品缓存成本低一个数量级,我们的定价策略将面临压力。窗口期:需立即评估我们平台是否已提供上下文缓存能力,以及缓存方案的成本结构。硬盘缓存方案是否值得我们借鉴以实现更低的缓存定价。

一句话摘要

DeepSeek 推出基于硬盘的上下文缓存技术,通过降低缓存存储成本实现大幅降价,是推理成本优化的创新方案。

详细描述

DeepSeek API launched context caching using hard disk caching technology, reducing prices by another order of magnitude compared to previous pricing.

DeepSeek API 创新性地采用硬盘缓存实现上下文缓存,价格再降一个数量级。

原文摘录

The DeepSeek API has innovatively adopted hard disk caching, reducing prices by another order of magnitude.