DeepSeek-V4-Pro 3 个月账单复盘:缓存命中率怎么跑起来的

我的使用场景 日常用 Claude Code 做两件事: CRUD 级改修(占 70%):单文件 < 500 行的小改动,Agent 模式 1-3 轮收 重构 / 新模块(占 30%):多文件跨模块,Agent 模式 5-15 轮 没跑训练、没跑长文档 summarization,所以输出占比低、输入缓存命中率是省钱关键——这跟写长文 / RAG 的人账单结构不一样,看的时候注意。 3 个月 Token 明细 月份 输入命中(MT) 输入未命中(MT) 输出(MT) 费用(¥) 缓存命中率 4 月 28.6 1.4 12.3 387 95.3% 5 月 41.2 1.8 15.1 421 95.8% 6 月 56.7 2.1 22.4 548 96.4% 数据来源:DeepSeek 控制台每月账单导出,模型 deepseek-v4-pro,未计入 V4-Flash 部分(Flash 那栏另算,占比 < 5%)。 几个观察: 输入命中率 95%+ 是因为同一个项目会话复用,项目文件 30K 那段基本全走缓存 未命中那 1.4-2.1 MT 主要是"新问题追加" + 工具调用结果(这部分没法缓存) 输出 6 元/MT 是贵项,但绝对量不大(我输出占比 ~8%) 跟 Claude Opus 4.1 比省多少 同用量(4 月口径:输入 30MT / 输出 12.3MT,按 Opus 缓存命中 $0.15/MT、未命中 $15/MT、输出 $75/MT,汇率 7.2 粗估): ...

July 3, 2026 · hd1990