VibeCafé
· Codex· Claude Code

新模型 GPT-5.5 在各工具里烧了多少 Token?怎么单独查

换上 GPT-5.5 之后想知道它单独烧了多少 Token,但 Codex、Cursor 的自带统计都只给总数,不按模型拆。这篇讲清为什么按模型查这么难,以及三种能把单个模型用量拆出来的方法。

新模型上线,第一件想干的事往往是「换上试试它到底烧不烧」。但你真换上 GPT-5.5 跑了几天,想回头算「这个模型单独花了我多少」,会发现出奇地难——Codex 的 codex usage 给的是总数,Cursor 给的是请求次数,没有一个工具默认按模型把账单拆开。这篇讲清为什么按单个模型查用量这么别扭,以及三种能真把它拆出来的方法。

先说结论:要按模型查,你得找一个「能区分 model 字段」的数据源。下面从最粗到最细排。

为什么自带统计查不了单个模型

大多数工具的自带用量是按「账号 / 计费周期」汇总的,不是按模型。原因很实际:对工具自己来说,它只需要知道「这个月该收你多少钱」,不需要替你拆「其中 GPT-5.5 占多少」。

所以你在 Codex 的 codex usage、Cursor 的 Usage 面板里看到的,都是把所有模型混在一起的总数。你换了 GPT-5.5 之后总消耗涨了,但涨的那部分到底是「新模型更烧」还是「这周你恰好干得多」,自带统计区分不了。要回答这个问题,得有按 model 维度拆开的数据。

方法一:服务商后台按模型看(如果是 API 计费)

如果你走的是 API 计费(比如直接用 OpenAI key 跑 Codex),服务商后台通常能按模型拆。

登录服务商的 Usage / Billing 页面,多数会有一个「按模型」的视图,能看到 gpt-5.5 这一行单独的 Token 数和费用。

它的短板

  1. 只覆盖走这个 key 的调用——你要是同一个 key 还跑了别的脚本、别的工具,全混在一起
  2. 看不到按项目拆(哪个仓库在用 GPT-5.5 烧得最多)
  3. 看不到缓存命中率——而这恰恰是新模型最该盯的(后面会讲)
  4. 订阅套餐用户基本看不到这页

方法二:自己解析本地日志

Claude Code 和 Codex 这类 CLI 把每场会话写在本地,每条 message 都带 modelusage 字段:

~/.claude/projects/<project>/<session>.jsonl
~/.codex/sessions/<session>.jsonl

理论上你可以写个脚本,把所有 jsonl 里 model 等于 gpt-5.5 的 message 的 token 加起来,就得到这个模型单独的消耗。

优势: 数据完整、能按模型也能按项目拆。

短板: 要自己写解析脚本,而且不同工具的 jsonl 结构略有差异;每想换个聚合维度(按天 / 按项目 / 按模型)都得改脚本。Cursor 更麻烦——它的数据在云端,本地没有这份日志。

方法三:用跨工具方案直接按模型拆

我自己用的是 Vibe Usage——它把方法二自动化了,而且天然按 model 维度统计。装好之后我能直接看到:

  • GPT-5.5 这个模型这个月单独烧了多少,和我还在用的 GPT-5.4、Claude Opus 各占多少
  • 换上 GPT-5.5 之后,我的总消耗到底是模型变了还是工作量变了——因为它把每个模型分开画了趋势线
  • GPT-5.5 的缓存命中率——这是我最该盯的一个数

新模型最该盯的不是「烧多少」,是缓存命中率

换新模型有个隐藏成本:换模型的时候人常常顺手清了上下文、开了新 session,把缓存打没了。新模型对缓存的依赖很高,一旦命中率掉下来,账单不是涨一点,是按好几倍往上窜。

所以查 GPT-5.5 的消耗,真正的重点不是看它绝对烧了多少,是看它的缓存命中率有没有掉。这个数自带统计基本都不给,得靠能区分 cached input 的工具看。缓存为什么这么关键,我们单独拆过 缓存输入 token 为什么能让账单差十倍

选哪个的简单判断

  • API 计费、只想看大盘费用:服务商后台的按模型视图
  • 想完全自己掌控数据、愿意写脚本:解析本地 jsonl
  • 想一眼看到 GPT-5.5 的用量 + 缓存命中率,还想和别的模型比:打开 Vibe Usage 按模型看一眼

我的经验是:换新模型那一周最值得查一次,看清它在你这儿的真实画像再决定要不要把它设成默认。我自己就是这么发现有个脚本早把默认拉成 GPT-5.5 了,每天在悄悄花钱——不查根本不知道。

相关阅读

新模型 GPT-5.5 在各工具里烧了多少 Token?怎么单独查