2026 年 3 月 20 日Claude CodeCodex CLIOpenCode通用

AI 编程 Token 浪费自查清单

不是要你抠门，是要你把每一笔 Token 花在该花的地方。这篇是一份 12 项的 Token 浪费自查清单——挨个对照你的当前用法，每条都有具体动作。

我自己每三个月会做一次 Token 浪费自查。每次都能从清单里揪出 2-3 个长期被忽视的浪费点。

这篇是我整理的 12 项检查清单——你装了 Claude Code、Codex、OpenCode 这些工具的话，照着对照一遍，多半能省 20-40% 月支出。

1. 系统提示里有动态内容吗

症状： 你的 CLAUDE.md / AGENTS.md / 自定义 prompt 里有时间戳、UUID、计数器、当前 git 分支这种每次都不一样的字段。

后果： 缓存全部失效。每次请求都按全价付。

动作： 把动态内容移到 prompt 的最末尾（消息内容里），稳定的内容放最前。

2. 大段中文项目说明

症状： AGENTS.md 里有 5000+ 字的中文项目背景。

后果： 中文 Token 密度高，5000 字 ≈ 9500 token。每次请求都要重发（虽然有缓存，但缓存失效时就贵）。

动作： 拆分。把"必读"和"按需查阅"分开。让模型只读必读部分，遇到具体问题再 @ 读其他文件。

3. 把所有项目都开 Claude Code

症状： 你电脑上 30 个项目，每个都装了 Claude Code，每个项目的 CLAUDE.md 都不一样。

后果： 跨项目切换时缓存全部冷启动。

动作： 选 5-10 个高频项目精心配置，其他项目直接走 chat 不开 Claude Code。

4. 行内 AI 一直挂着

症状： Cursor / VS Code 的行内 AI 提示一直开着，你大部分时间不接受它的建议。

后果： 后台一直在跑，零碎消耗大。

动作： 切到手动触发模式（Cursor Tab 关掉自动建议）。或者明确分时段——你写新代码时开，重构时关。

5. 自动 commit message 生成

症状： 每次 git commit 都让 AI 帮你写 message。

后果： 每次 200-500 output token。一天 10 个 commit 就是 5000 token，一个月几十万。

动作： 关掉自动，自己写 commit message——你大概率写得比 AI 简洁。

6. 对话历史塞了无关讨论

症状： 你在 Claude Code 里问完问题 A 之后接着问问题 B，B 跟 A 完全无关。

后果： 问 B 时 input 包含 A 的全部讨论。重复支付 A 的上下文。

动作： 切话题就开新 session。或者用 /compact 把无关历史压掉。

7. 调试任务跑大模型

症状： debug 一个简单的 typo 错误也用 Opus / GPT-5.5 thinking。

后果： 单价高 5-10 倍。简单 bug 用大模型纯属浪费。

动作： 默认 Sonnet。Opus 只用于"Sonnet 给不出答案的事"——大概是 5% 任务。

8. 让 Agent 自己探索全仓库

症状： 你给 Codex / Claude Code 一个任务，没指定文件范围，让它自己 grep 找相关代码。

后果： 单 session 上下文容易冲到几百万 Token。

动作： 任务前自己定位 5-10 个相关文件，明确 @ 给 Agent。

9. 长 Session 不 compact

症状： Claude Code 一个 session 开 3 小时还没退出。

后果： input 累计 200-500 万 Token，每条新消息都贵。

动作： 每 1-2 小时主动 /compact。或者跨阶段时直接退出开新 session。

10. JSON 配置 / 大段日志直接贴给模型

症状： "帮我看下这个 log 里出了什么问题"，然后贴一份 5000 行的日志。

后果： 一份大日志可能就是 50 万 Token。

动作： 自己先 grep 出相关 50-100 行再贴。或者用 head -n 200 log | tail -n 100 这种方式精简。

11. 重复跑同样的"查询"

症状： "帮我查 GraphQL 的 syntax"——每天问 3 次，每次都从头解释。

后果： 同样答案花 3 次钱。

动作： 把高频查询的答案存到本地 doc / Obsidian，第二次直接查本地。

12. 不看自己的真实消耗

症状： 你订阅了 Claude Pro / Max，从来没看过自己每月按 API 算多少钱。

后果： 套餐买高了或者买低了你都不知道。

动作： 装 Vibe Usage 看自己 Claude Code 的真实消耗——它能把订阅期间的消耗按 API 价格反算出来，告诉你换 API 划不划算。

自查频率

每三个月一次足够。不要每周自查——容易陷入"只要省钱"的执念，反而把高价值任务也砍掉。

理想的节奏：

每月看一次 Vibe Usage 的总趋势——有没有突然冒尖
每季度按这份清单挨个对照一次
每半年大改一次——看哪些工具能弃用、哪些套餐能调整

一个核心心态

省 Token 不是目的。让你的每一笔 Token 花得有清晰回报才是目的。

我每次清单走完都会反问自己："这一项节省的 X 美元，会让我的工作慢多少？"如果会让我慢——那这一项就别省。

数据是这种判断的基础。打开 Vibe Usage 看自己消耗结构是第一步，比这份清单本身重要。