AI 编程 Token 浪费自查清单
不是要你抠门,是要你把每一笔 Token 花在该花的地方。这篇是一份 12 项的 Token 浪费自查清单——挨个对照你的当前用法,每条都有具体动作。
我自己每三个月会做一次 Token 浪费自查。每次都能从清单里揪出 2-3 个长期被忽视的浪费点。
这篇是我整理的 12 项检查清单——你装了 Claude Code、Codex、OpenCode 这些工具的话,照着对照一遍,多半能省 20-40% 月支出。
1. 系统提示里有动态内容吗
症状: 你的 CLAUDE.md / AGENTS.md / 自定义 prompt 里有时间戳、UUID、计数器、当前 git 分支这种每次都不一样的字段。
后果: 缓存全部失效。每次请求都按全价付。
动作: 把动态内容移到 prompt 的最末尾(消息内容里),稳定的内容放最前。
2. 大段中文项目说明
症状: AGENTS.md 里有 5000+ 字的中文项目背景。
后果: 中文 Token 密度高,5000 字 ≈ 9500 token。每次请求都要重发(虽然有缓存,但缓存失效时就贵)。
动作: 拆分。把"必读"和"按需查阅"分开。让模型只读必读部分,遇到具体问题再 @ 读其他文件。
3. 把所有项目都开 Claude Code
症状: 你电脑上 30 个项目,每个都装了 Claude Code,每个项目的 CLAUDE.md 都不一样。
后果: 跨项目切换时缓存全部冷启动。
动作: 选 5-10 个高频项目精心配置,其他项目直接走 chat 不开 Claude Code。
4. 行内 AI 一直挂着
症状: Cursor / VS Code 的行内 AI 提示一直开着,你大部分时间不接受它的建议。
后果: 后台一直在跑,零碎消耗大。
动作: 切到手动触发模式(Cursor Tab 关掉自动建议)。或者明确分时段——你写新代码时开,重构时关。
5. 自动 commit message 生成
症状: 每次 git commit 都让 AI 帮你写 message。
后果: 每次 200-500 output token。一天 10 个 commit 就是 5000 token,一个月几十万。
动作: 关掉自动,自己写 commit message——你大概率写得比 AI 简洁。
6. 对话历史塞了无关讨论
症状: 你在 Claude Code 里问完问题 A 之后接着问问题 B,B 跟 A 完全无关。
后果: 问 B 时 input 包含 A 的全部讨论。重复支付 A 的上下文。
动作: 切话题就开新 session。或者用 /compact 把无关历史压掉。
7. 调试任务跑大模型
症状: debug 一个简单的 typo 错误也用 Opus / GPT-5.5 thinking。
后果: 单价高 5-10 倍。简单 bug 用大模型纯属浪费。
动作: 默认 Sonnet。Opus 只用于"Sonnet 给不出答案的事"——大概是 5% 任务。
8. 让 Agent 自己探索全仓库
症状: 你给 Codex / Claude Code 一个任务,没指定文件范围,让它自己 grep 找相关代码。
后果: 单 session 上下文容易冲到几百万 Token。
动作: 任务前自己定位 5-10 个相关文件,明确 @ 给 Agent。
9. 长 Session 不 compact
症状: Claude Code 一个 session 开 3 小时还没退出。
后果: input 累计 200-500 万 Token,每条新消息都贵。
动作: 每 1-2 小时主动 /compact。或者跨阶段时直接退出开新 session。
10. JSON 配置 / 大段日志直接贴给模型
症状: "帮我看下这个 log 里出了什么问题",然后贴一份 5000 行的日志。
后果: 一份大日志可能就是 50 万 Token。
动作: 自己先 grep 出相关 50-100 行再贴。或者用 head -n 200 log | tail -n 100 这种方式精简。
11. 重复跑同样的"查询"
症状: "帮我查 GraphQL 的 syntax"——每天问 3 次,每次都从头解释。
后果: 同样答案花 3 次钱。
动作: 把高频查询的答案存到本地 doc / Obsidian,第二次直接查本地。
12. 不看自己的真实消耗
症状: 你订阅了 Claude Pro / Max,从来没看过自己每月按 API 算多少钱。
后果: 套餐买高了或者买低了你都不知道。
动作: 装 Vibe Usage 看自己 Claude Code 的真实消耗——它能把订阅期间的消耗按 API 价格反算出来,告诉你换 API 划不划算。
自查频率
每三个月一次足够。不要每周自查——容易陷入"只要省钱"的执念,反而把高价值任务也砍掉。
理想的节奏:
- 每月看一次 Vibe Usage 的总趋势——有没有突然冒尖
- 每季度按这份清单挨个对照一次
- 每半年大改一次——看哪些工具能弃用、哪些套餐能调整
一个核心心态
省 Token 不是目的。让你的每一笔 Token 花得有清晰回报才是目的。
我每次清单走完都会反问自己:"这一项节省的 X 美元,会让我的工作慢多少?"如果会让我慢——那这一项就别省。
数据是这种判断的基础。打开 Vibe Usage 看自己消耗结构 是第一步,比这份清单本身重要。