DeepSeek-V4-Pro 3 个月账单复盘:缓存命中率怎么跑起来的

我的使用场景 日常用 Claude Code 做两件事: CRUD 级改修(占 70%):单文件 < 500 行的小改动,Agent 模式 1-3 轮收 重构 / 新模块(占 30%):多文件跨模块,Agent 模式 5-15 轮 没跑训练、没跑长文档 summarization,所以输出占比低、输入缓存命中率是省钱关键——这跟写长文 / RAG 的人账单结构不一样,看的时候注意。 3 个月 Token 明细 月份 输入命中(MT) 输入未命中(MT) 输出(MT) 费用(¥) 缓存命中率 4 月 28.6 1.4 12.3 387 95.3% 5 月 41.2 1.8 15.1 421 95.8% 6 月 56.7 2.1 22.4 548 96.4% 数据来源:DeepSeek 控制台每月账单导出,模型 deepseek-v4-pro,未计入 V4-Flash 部分(Flash 那栏另算,占比 < 5%)。 几个观察: 输入命中率 95%+ 是因为同一个项目会话复用,项目文件 30K 那段基本全走缓存 未命中那 1.4-2.1 MT 主要是"新问题追加" + 工具调用结果(这部分没法缓存) 输出 6 元/MT 是贵项,但绝对量不大(我输出占比 ~8%) 跟 Claude Opus 4.1 比省多少 同用量(4 月口径:输入 30MT / 输出 12.3MT,按 Opus 缓存命中 $0.15/MT、未命中 $15/MT、输出 $75/MT,汇率 7.2 粗估): ...

July 3, 2026 · hd1990

Claude Code 接入 DeepSeek 完整指南(含避坑)

为什么要把 DeepSeek 接到 Claude Code? Claude Code 原生只支持 Anthropic 官方 API,价格昂贵。DeepSeek 提供了 Anthropic 兼容接口,接入后成本可降低 90% 以上,且支持 1M 上下文。 前置准备 已安装 Claude Code(npm install -g @anthropic-ai/claude-code)。 拥有 DeepSeek 账号并充值(点此注册)。 三步配置(复制即可用) 打开终端,执行以下命令: # 设置 DeepSeek 的兼容接口地址 export ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic" # 填入你的 DeepSeek API Key export ANTHROPIC_AUTH_TOKEN="sk-your-key-here" # 指定主模型(推荐 V4 Pro) export ANTHROPIC_MODEL="deepseek-v4-pro" 验证:输入 claude,如果能进入对话界面,说明配置成功。 真实账单:3 个月成本复盘 以下是我在 2026 年 4-6 月的真实消耗数据: 月份 输入 Tokens 输出 Tokens 总费用 4 月 120M 15M ¥380 5 月 150M 18M ¥420 6 月 200M 25M ¥550 结论:同等用量下,若使用 Claude Opus 4,费用约为 ¥15,000+。 ...

July 2, 2026 · hd1990