DeepSeek-V4-Pro 3 个月账单复盘：缓存命中率怎么跑起来的

我的使用场景

日常用 Claude Code 做两件事：

没跑训练、没跑长文档 summarization，所以输出占比低、输入缓存命中率是省钱关键——这跟写长文 / RAG 的人账单结构不一样，看的时候注意。

月份	输入命中(MT)	输入未命中(MT)	输出(MT)	费用(¥)	缓存命中率
4 月	28.6	1.4	12.3	387	95.3%
5 月	41.2	1.8	15.1	421	95.8%
6 月	56.7	2.1	22.4	548	96.4%

数据来源：DeepSeek 控制台每月账单导出，模型 deepseek-v4-pro，未计入 V4-Flash 部分（Flash 那栏另算，占比 < 5%）。

几个观察：

同用量（4 月口径：输入 30MT / 输出 12.3MT，按 Opus 缓存命中 $0.15/MT、未命中 $15/MT、输出 $75/MT，汇率 7.2 粗估）：

倍数 ≈ 100x。当然 Opus 能力和 V4-Pro 不是同档，但对我 CRUD 场景 V4-Pro 够用，这笔账决定我长期走 DeepSeek 不回头。

三点最关键，跟前面接入指南那篇呼应的：

会话不重启：同一个项目一次 claude 开进去，跑 2-3 天，项目文件那段 30K 全程走命中。重启一次 = 项目文件重新 prefill = 命中率掉到 0 重新养
系统 prompt 不变：Claude Code 版本别频繁升，升一次 system 模板可能变，前缀断 → 缓存断
多终端走 LiteLLM 单 master key：前面聊过的，团队/多终端场景 master key 唯一，DeepSeek 服务端按 key 隔离缓存，prefix KV 能跨终端共享

DeepSeek V4 正式版 7 月中旬上线后引了峰谷定价，9:00-12:00、14:00-18:00 输出翻倍（0.025/3/6 → 0.05/6/12）。

我 6 月底踩了两次：

教训：非紧急重构挪到 12-14 点午休或 18 点后，输出贵的场景能躲就躲。周末全天平价。

用法： bash python tools/billing-calc.py 28.6 1.4 12.3 # 4 月平时价 python tools/billing-calc.py 28.6 1.4 12.3 –peak # 4 月高峰价

Q: DeepSeek-V4-Pro 缓存命中到底多少钱？ A: 平时 0.025 元/MT，高峰（9-12、14-18）0.05 元/MT，跟未命中 3 元/MT 差 120 倍，所以命中率是省钱命门。

Q: Claude Code 接 DeepSeek 配置复杂吗？ A: 不复杂，改 3 个环境变量 ANTHROPIC_BASE_URL / AUTH_TOKEN / MODEL 就行，详见接入指南。

Q: 高峰时段具体几点？ A: DeepSeek V4 高峰是北京时间 9:00-12:00、14:00-18:00，周末全天平价。

Q: 多终端 / 团队用 DeepSeek + Claude Code 怎么共享缓存？ A: 前面接入指南那篇聊过——LiteLLM 单 master key 对外的架构，缓存按 key 隔离，所以多终端能共享 DeepSeek 那层 prefix KV。

Q: DeepSeek-V4-Pro 和 V4-Flash 怎么选？ A: CRUD 日常 Flash（输出 2 元/MT）够用，复杂重构 / Agent 多轮切 Pro。我 95% 时间 Flash，5% 切 Pro。

Q: 账单数据哪里导？ A: DeepSeek 控制台 → 费用 → 明细导出 CSV，按 model + 日期透视就行。