Claude Code vs Codex CLI vs OpenCode:哪个最烧 Token?真实对比
看了 30 天里 6 个主流工具的真实消耗数据——Codex 是绝对的 Token 之王,但单用户消耗排序你可能猜不到。这篇用 Vibe Usage 上 368 个开发者的数据告诉你。
「Claude Code、Codex CLI、OpenCode——哪个最烧 Token?」是我被问最多的问题。
之前都是凭感觉答。这次我看了 Vibe Usage 上 368 个真实开发者过去 30 天的消耗数据——结论比任何主观感受都直接。
直接看数据
近 30 天,6 个主流工具的总 token 消耗:
| 工具 | 总 token(亿) | 用户数 | 单用户均值(百万) |
|---|---|---|---|
| Codex CLI | 730 | 286 | 255 |
| Claude Code | 491 | 307 | 160 |
| openclaw | 181 | 97 | 186 |
| OpenCode | 125 | 98 | 127 |
| hermes | 32 | 64 | 51 |
| Gemini CLI | 7 | 50 | 14 |
Codex 是绝对的 token 之王——总量 730 亿,比 Claude Code 多 50%。但用户数比 Claude Code 还少。这意味着 Codex 单用户均消耗远高于 Claude Code——是 Claude Code 的 1.6 倍。
让人意外的是 openclaw——单用户消耗 1.86 亿,比 Claude Code 还高 15%。说明这个工具的用户也是重度群体。
为什么 Codex 这么烧
Codex 的工作模式是 Agent 循环。我看 session 数据:
| 工具 | 平均会话长度 | 平均消息数 | p50 message 数 |
|---|---|---|---|
| Codex CLI | 170 分钟 | 544 | 104 |
| Claude Code | 81 分钟 | 63 | 10 |
| openclaw | 151 分钟 | 39 | 8 |
| OpenCode | 59 分钟 | 20 | 7 |
| Gemini CLI | 14 分钟 | 4.2 | 2 |
Codex 单次会话平均 544 条消息——这是 Claude Code 的 8.6 倍。每条消息都是一次完整的 LLM 调用,循环越多 token 越多。
Codex 在做的事是"自主任务执行"——你给一个任务,它自己规划、读、写、测、修。每一步都是一次模型调用。
缓存命中率拉开差距
但单看 token 总量不公平。要看实际计费,得看缓存命中率:
| 工具 | 缓存命中率 |
|---|---|
| Codex CLI | 92% |
| Claude Code | 91% |
| OpenCode | 67% |
| Gemini CLI | 59% |
| openclaw | 53% |
| hermes | 51% |
Codex 和 Claude Code 都是 90%+。这意味着虽然 Codex 总 token 数高,但实际计费的"全价 input"占比很小——大部分 input 走缓存价(10% 全价)。
OpenCode 和 openclaw 缓存命中率不到 70%。它们 token 总量看着比 Codex 低,但实际"按全价计费的 input"占比高得多。
各工具的输出/输入比
Output token 比 input 贵 5 倍。所以"输出占比"也影响最终账单:
| 工具 | output / input |
|---|---|
| Codex CLI | 4% |
| Claude Code | 6% |
| OpenCode | 1.3% |
| Gemini CLI | 27% |
| openclaw | 19% |
OpenCode 极低的 output/input 比说明它主要是"读多写少"——上下文消耗为主,最终代码生成相对短。Gemini CLI 的 27% 是因为它经常被用来做长输出场景(生成报告、写文档)。
单用户实际月支出估算
把所有变量综合,按 Sonnet 4.6 价格折算:
| 工具 | 单用户月支出(美元) |
|---|---|
| Codex CLI | $32 |
| Claude Code | $19 |
| openclaw | $35 |
| OpenCode | $12 |
| hermes | $4.5 |
| Gemini CLI | $1.5 |
注意:Codex 用户主要付给 OpenAI,Claude Code 付给 Anthropic(订阅或 API)。这是人均支出,不是用户总支出(重度用户实际可能 200+ 美元 / 月)。
关键 takeaway
- Codex 单用户最烧 —— 平均 32 美元 / 月,是 Claude Code 1.7 倍
- openclaw 用户消耗高 —— 这个国产工具的用户也是重度群体
- OpenCode 实际不便宜 —— 缓存命中率低让"便宜 provider"优势打折
- Gemini CLI 用户消耗低 —— 多数人偶尔用一下就关
- 缓存命中率是最大变量 —— 优化它比换工具效果还好
怎么看自己的真实数据
- 你的 Codex 占比是多少
- 你的缓存命中率比群体均值高还是低
- 哪个工具最烧,哪个最便宜
- 这个月趋势是涨是跌
我自己装 Vibe Usage 之前以为 Claude Code 是大头,看完数据发现 Codex 才是。如果不在同一个面板里看,永远做不出这种正确的优化决策。
一个反直觉结论
很多人想省钱时第一反应是"换便宜 provider"——比如从 Claude 切到 GLM。但实际数据:换 provider 省的钱不如优化使用模式。
Claude Code 缓存命中率从 70% 提到 91%,等于 21% 的 input 直接降 90% 价。比换 provider 便宜 5 倍效果还好。
把 Vibe Usage 装上,按数据决策——比按"便宜 provider"决策聪明。