2026 年 2 月 22 日· Claude Code· Codex· Gemini CLI

AI 编程一个月真实成本拆解：钱都花在哪

以一个真实开发者的一个月账单为样本，把 AI 编程的成本拆开看——基础订阅、API 突击、模型差异、工具组合，每一笔花在哪都讲清。让你下次申请预算或评估 ROI 心里有数。

我每个月会做一件别人不太做的事：把上个月所有 AI 工具的账单拆开看一遍，搞清楚每一笔钱到底花在哪。这件事坚持了大半年，我对 AI 编程"贵在哪"有了一些和直觉相反的发现。

这篇用我自己上个月的真实账单做模板，把成本结构讲清楚——你可以照着自检自己的钱花得值不值。

上个月真实账单

第一个反直觉点：最大头不是 Claude 系。是 Codex CLI 烧的 OpenAI API。我以为 Claude Code 是我用得最多的工具，但实际上 Codex 单笔任务消耗远超 Claude——尤其是大重构。

把同一份账单按"工作类型"重新切一遍：

第二个反直觉点：单次大重构是真烧钱。 一次跨 30 文件的重构动辄 5-15 美元，一个月做几次累计接近 100 美元。但这部分钱往往花得最值——它替换的是几小时的人工时间。

第三个反直觉点：「学习和探索」也烧不少。我习惯用 Claude Code 帮我读陌生代码库——加载完整代码上下文每次都是 50 万-200 万 Token。这部分容易被忽略，但累计起来不小。

我盯着这份账单一个月一个月看下来，发现三个"花钱黑洞"反复出现：

1. Agent 任务跑偏的二次成本

让 Codex 跑一个重构，结果它走了岔路——读了一堆不相关的文件、改坏了别的功能、搞了三十次循环最终给出错误结果。这种失败任务的成本是 1.5-3 美元，是成功任务的 2-3 倍。

怎么省：写更精确的 prompt，明确告诉 Agent「只改 X 文件」「不要动测试」。我现在养成习惯——大任务前先用 Claude Code chat 模式让它说一遍计划，确认无误再让 Codex 跑。

2. 重复打开关闭 session 的上下文重建

我以前频繁开关 Claude Code（写两句话退出，半小时后又打开）。每次新 session 都从零重建上下文——CLAUDE.md、文件树、当前 git 状态——大约 5-15 万 input Token。一天开关 20 次就是 200-300 万 Token 的额外开销。

怎么省：长时间挂着 session，哪怕没输入。Claude Code 不会主动消耗 Token，但保持上下文活着，下次接着说省一大笔重建成本。

3. 不知不觉激活的高价模型

Claude Code 默认用 Sonnet，但你能切到 Opus。Opus 的 input 价是 15 美元 / 百万，Sonnet 是 3 美元——差 5 倍。我有一次切到 Opus 试试效果，忘了切回来，那一周账单多了 60 美元。

怎么省：Sonnet 是 95% 任务的最优选择。Opus 留给「Sonnet 给不出的复杂推理」——比如设计大型系统架构、debug 真正诡异的并发问题。

不是为了省钱。是为了让你的 AI 投入和价值挂钩。

我现在每月看完账单都会问自己：

如果某一类的 ROI 算不过来，下个月就限制它。这比一刀切「我要省钱」更精准。

订阅类账单（Claude Pro / Max、Copilot、Cursor）你没法拆——固定金额，反正都付了。要拆的是 API 走法的部分（Claude API、OpenAI API、Gemini API）。

最简单的方式是打开 Vibe Usage 看自己的消耗按工具、按项目、按模型分布。它会把 Claude Code、Codex、Grok 等工具的消耗按你想要的维度切，和上面这份账单基本可以一对一映射。

我自己拆了三个月之后才看出"原来 Codex 占了大头"这种事。光看 Anthropic / OpenAI 的 console 看不出来——它们只告诉你总数，不告诉你这些钱是被哪个工具、哪个项目、哪个任务烧掉的。

AI 编程的钱不是"成本"，是"杠杆"。
189 美元换 30 小时高质量代码产出——单算时薪就值 6 美元，远低于任何工程师的市场价。

但前提是你得知道这 189 美元怎么花的。账单不拆，你就在盲目消费；账单拆了，你就在按 ROI 投资。

装 Vibe Usage 拆一次自己的 AI 账单，看完你会有完全不一样的理解。