Claude CodeCodex CLIGemini CLI

AI 编程一个月真实成本拆解:钱都花在哪

以一个真实开发者的一个月账单为样本,把 AI 编程的成本拆开看——基础订阅、API 突击、模型差异、工具组合,每一笔花在哪都讲清。让你下次申请预算或评估 ROI 心里有数。

我每个月会做一件别人不太做的事:把上个月所有 AI 工具的账单拆开看一遍,搞清楚每一笔钱到底花在哪。这件事坚持了大半年,我对 AI 编程"贵在哪"有了一些和直觉相反的发现。

这篇用我自己上个月的真实账单做模板,把成本结构讲清楚——你可以照着自检自己的钱花得值不值。

上个月真实账单

项目 金额 占比
Claude Pro 订阅 20 美元 11%
Claude API(超出订阅的部分) 47 美元 25%
OpenAI API(Codex CLI) 92 美元 49%
GitHub Copilot 10 美元 5%
Gemini API(CLI 试用) 12 美元 6%
Cursor Pro 订阅 8 美元 4%
合计 189 美元 100%

第一个反直觉点:最大头不是 Claude 系。是 Codex CLI 烧的 OpenAI API。我以为 Claude Code 是我用得最多的工具,但实际上 Codex 单笔任务消耗远超 Claude——尤其是大重构。

拆开看:这 189 美元分布在哪

把同一份账单按"工作类型"重新切一遍:

工作类型 估算成本 占比
大重构(跨文件改造) 78 美元 41%
新功能开发 41 美元 22%
Debug 和修复 32 美元 17%
写 / 改测试 14 美元 7%
学习和探索(看新 API、读源码) 12 美元 6%
写文档 / commit message 8 美元 4%
其他 4 美元 2%

第二个反直觉点:单次大重构是真烧钱。 一次跨 30 文件的重构动辄 5-15 美元,一个月做几次累计接近 100 美元。但这部分钱往往花得最值——它替换的是几小时的人工时间。

第三个反直觉点:「学习和探索」也烧不少。我习惯用 Claude Code 帮我读陌生代码库——加载完整代码上下文每次都是 50 万-200 万 Token。这部分容易被忽略,但累计起来不小。

最容易超预算的三个场景

我盯着这份账单一个月一个月看下来,发现三个"花钱黑洞"反复出现:

1. Agent 任务跑偏的二次成本

让 Codex 跑一个重构,结果它走了岔路——读了一堆不相关的文件、改坏了别的功能、搞了三十次循环最终给出错误结果。这种失败任务的成本是 1.5-3 美元,是成功任务的 2-3 倍。

怎么省:写更精确的 prompt,明确告诉 Agent「只改 X 文件」「不要动测试」。我现在养成习惯——大任务前先用 Claude Code chat 模式让它说一遍计划,确认无误再让 Codex 跑。

2. 重复打开关闭 session 的上下文重建

我以前频繁开关 Claude Code(写两句话退出,半小时后又打开)。每次新 session 都从零重建上下文——CLAUDE.md、文件树、当前 git 状态——大约 5-15 万 input Token。一天开关 20 次就是 200-300 万 Token 的额外开销。

怎么省:长时间挂着 session,哪怕没输入。Claude Code 不会主动消耗 Token,但保持上下文活着,下次接着说省一大笔重建成本。

3. 不知不觉激活的高价模型

Claude Code 默认用 Sonnet,但你能切到 Opus。Opus 的 input 价是 15 美元 / 百万,Sonnet 是 3 美元——差 5 倍。我有一次切到 Opus 试试效果,忘了切回来,那一周账单多了 60 美元。

怎么省:Sonnet 是 95% 任务的最优选择。Opus 留给「Sonnet 给不出的复杂推理」——比如设计大型系统架构、debug 真正诡异的并发问题。

把账单拆开是为了什么

不是为了省钱。是为了让你的 AI 投入和价值挂钩

我现在每月看完账单都会问自己:

  • 这 80 美元的"大重构成本"——替换的人工时间值吗?(如果是 8 小时人工 × 100 美元 / 时 = 800 美元,那 80 美元很值)
  • 这 12 美元的"学习探索"——我学到的东西值吗?(如果带来一次设计灵感,远值)
  • 这 32 美元的 debug——这些 bug 我自己能多快找到?(如果是节省了我 4 小时苦战,值)

如果某一类的 ROI 算不过来,下个月就限制它。这比一刀切「我要省钱」更精准。

想拆自己的账单怎么办

订阅类账单(Claude Pro / Max、Copilot、Cursor)你没法拆——固定金额,反正都付了。要拆的是 API 走法的部分(Claude API、OpenAI API、Gemini API)。

最简单的方式是 打开 Vibe Usage 看自己的消耗按工具、按项目、按模型分布。它会把 Claude Code、Codex、Gemini CLI 等工具的消耗按你想要的维度切,和上面这份账单基本可以一对一映射。

我自己拆了三个月之后才看出"原来 Codex 占了大头"这种事。光看 Anthropic / OpenAI 的 console 看不出来——它们只告诉你总数,不告诉你这些钱是被哪个工具、哪个项目、哪个任务烧掉的。

一个心态调整

AI 编程的钱不是"成本",是"杠杆"。 189 美元换 30 小时高质量代码产出——单算时薪就值 6 美元,远低于任何工程师的市场价。

但前提是你得知道这 189 美元怎么花的。账单不拆,你就在盲目消费;账单拆了,你就在按 ROI 投资。

装 Vibe Usage 拆一次自己的 AI 账单,看完你会有完全不一样的理解。

相关阅读

相关阅读

AI 编程一个月真实成本拆解:钱都花在哪