Claude CodeCodex CLIOpenCode通用

AI 编程 Token 浪费自查清单

不是要你抠门,是要你把每一笔 Token 花在该花的地方。这篇是一份 12 项的 Token 浪费自查清单——挨个对照你的当前用法,每条都有具体动作。

我自己每三个月会做一次 Token 浪费自查。每次都能从清单里揪出 2-3 个长期被忽视的浪费点。

这篇是我整理的 12 项检查清单——你装了 Claude Code、Codex、OpenCode 这些工具的话,照着对照一遍,多半能省 20-40% 月支出。

1. 系统提示里有动态内容吗

症状: 你的 CLAUDE.md / AGENTS.md / 自定义 prompt 里有时间戳、UUID、计数器、当前 git 分支这种每次都不一样的字段。

后果: 缓存全部失效。每次请求都按全价付。

动作: 把动态内容移到 prompt 的最末尾(消息内容里),稳定的内容放最前。

2. 大段中文项目说明

症状: AGENTS.md 里有 5000+ 字的中文项目背景。

后果: 中文 Token 密度高,5000 字 ≈ 9500 token。每次请求都要重发(虽然有缓存,但缓存失效时就贵)。

动作: 拆分。把"必读"和"按需查阅"分开。让模型只读必读部分,遇到具体问题再 @ 读其他文件。

3. 把所有项目都开 Claude Code

症状: 你电脑上 30 个项目,每个都装了 Claude Code,每个项目的 CLAUDE.md 都不一样。

后果: 跨项目切换时缓存全部冷启动。

动作: 选 5-10 个高频项目精心配置,其他项目直接走 chat 不开 Claude Code。

4. 行内 AI 一直挂着

症状: Cursor / VS Code 的行内 AI 提示一直开着,你大部分时间不接受它的建议。

后果: 后台一直在跑,零碎消耗大。

动作: 切到手动触发模式(Cursor Tab 关掉自动建议)。或者明确分时段——你写新代码时开,重构时关。

5. 自动 commit message 生成

症状: 每次 git commit 都让 AI 帮你写 message。

后果: 每次 200-500 output token。一天 10 个 commit 就是 5000 token,一个月几十万。

动作: 关掉自动,自己写 commit message——你大概率写得比 AI 简洁。

6. 对话历史塞了无关讨论

症状: 你在 Claude Code 里问完问题 A 之后接着问问题 B,B 跟 A 完全无关。

后果: 问 B 时 input 包含 A 的全部讨论。重复支付 A 的上下文。

动作: 切话题就开新 session。或者用 /compact 把无关历史压掉。

7. 调试任务跑大模型

症状: debug 一个简单的 typo 错误也用 Opus / GPT-5.5 thinking。

后果: 单价高 5-10 倍。简单 bug 用大模型纯属浪费。

动作: 默认 Sonnet。Opus 只用于"Sonnet 给不出答案的事"——大概是 5% 任务。

8. 让 Agent 自己探索全仓库

症状: 你给 Codex / Claude Code 一个任务,没指定文件范围,让它自己 grep 找相关代码。

后果: 单 session 上下文容易冲到几百万 Token。

动作: 任务前自己定位 5-10 个相关文件,明确 @ 给 Agent。

9. 长 Session 不 compact

症状: Claude Code 一个 session 开 3 小时还没退出。

后果: input 累计 200-500 万 Token,每条新消息都贵。

动作: 每 1-2 小时主动 /compact。或者跨阶段时直接退出开新 session。

10. JSON 配置 / 大段日志直接贴给模型

症状: "帮我看下这个 log 里出了什么问题",然后贴一份 5000 行的日志。

后果: 一份大日志可能就是 50 万 Token。

动作: 自己先 grep 出相关 50-100 行再贴。或者用 head -n 200 log | tail -n 100 这种方式精简。

11. 重复跑同样的"查询"

症状: "帮我查 GraphQL 的 syntax"——每天问 3 次,每次都从头解释。

后果: 同样答案花 3 次钱。

动作: 把高频查询的答案存到本地 doc / Obsidian,第二次直接查本地。

12. 不看自己的真实消耗

症状: 你订阅了 Claude Pro / Max,从来没看过自己每月按 API 算多少钱。

后果: 套餐买高了或者买低了你都不知道。

动作: 装 Vibe Usage 看自己 Claude Code 的真实消耗——它能把订阅期间的消耗按 API 价格反算出来,告诉你换 API 划不划算。

自查频率

每三个月一次足够。不要每周自查——容易陷入"只要省钱"的执念,反而把高价值任务也砍掉。

理想的节奏:

  • 每月看一次 Vibe Usage 的总趋势——有没有突然冒尖
  • 每季度按这份清单挨个对照一次
  • 每半年大改一次——看哪些工具能弃用、哪些套餐能调整

一个核心心态

省 Token 不是目的。让你的每一笔 Token 花得有清晰回报才是目的。

我每次清单走完都会反问自己:"这一项节省的 X 美元,会让我的工作慢多少?"如果会让我慢——那这一项就别省。

数据是这种判断的基础。打开 Vibe Usage 看自己消耗结构 是第一步,比这份清单本身重要。

相关阅读

相关阅读

AI 编程 Token 浪费自查清单