Claude CodeCodex CLIGemini CLIOpenCode

如何统计多个 AI 编程工具的总 Token 消耗

你同时用 Claude Code、Codex CLI、Gemini CLI 三个工具,每个工具的消耗都散落在不同地方——这篇讲清各工具自带统计的局限,以及一个能把它们统一起来的办法。

我电脑上同时装了 Claude Code、Codex CLI、Gemini CLI、OpenCode 四个工具。每个都好用,每个都有适合的场景,但有一件事让我抓狂:我不知道这四个工具加起来到底烧了多少 Token

每个工具的统计入口都不一样,格式不一样,时间窗口不一样,单位也不一样。这篇讲清这件事的现状、各工具自带统计的天花板,以及怎么把数字加起来。

各工具自带统计长什么样

先说一遍各工具能告诉你什么。

Claude Code 有个 /cost 命令。在会话里输入它,会打出当前 session 的 input/output/cached 各类 Token 数和估算费用。但它只看当前 session——你昨天那场会话已经看不到了。如果想看跨会话统计,得自己去翻 ~/.claude/projects/ 下面的 jsonl 文件,自己解析。

Codex CLI 比较好一点。codex usage 子命令能看到本周和本月汇总。但它只看 OpenAI 一家,而且只有 input/output 两个数字,不细分模型。

Gemini CLI 几乎没有自带统计。你只能去 Google Cloud Console 的 API 计量页面看,颗粒度按天,没法按项目区分。

OpenCode 输出每次调用都打印 Token 数到 stderr,但没有汇总。如果想统计今天用了多少,你要么开 telemetry 写到日志再自己解析,要么用 Provider 的 dashboard。

四个工具,四套口径,对账完全是噩梦。

凑数据的笨办法

我一开始的笨办法是这样的:

每周日晚上花半小时,挨个打开各家的 dashboard 截图,再抄到一个 Google Sheet 里。Anthropic 的 Console、OpenAI 的 Usage 页、Google Cloud 的 Billing。光打开这几个页面就要登录三次。

这样做了三周我就放弃了。两个原因:

第一,口径对不上。Anthropic 给的是按 API key、按天的 Token 数,OpenAI 给的是按模型、按小时的 Token 数。我没法把它们按"项目"或"工作内容"对齐。

第二,没法看趋势。最有用的问题——这周的消耗比上周高了多少?高在哪个工具上?哪个项目花最多?——dashboard 都答不出来。

把它们扔到一个地方看

后来我发现一个简单的事实:所有这些工具的真实消耗其实都已经写在你电脑的本地日志里了——Claude Code 写在 ~/.claude/projects/,Codex 写在 ~/.codex/sessions/,Gemini 写在 ~/.gemini/,OpenCode 写在 ~/.config/opencode/

只要有个东西能定时扫这些目录、解析格式、汇总到一起,你就有了完整画面。

我现在用的就是 Vibe Usage。免费,跑在本地,自动读各工具的日志文件,把所有消耗按天、按工具、按模型、按项目汇总。我装好之后什么都没配——它自己识别我装了哪些工具,自动开始同步。

最让我满意的是它的"对比视图"——同一时间段,Claude Code 烧了多少、Codex 烧了多少、各自占比多少,一眼就能看出哪个工具是大头、最近哪个项目突然冒尖。

一个反直觉的发现

装上之后第一周,我就看到一个意外的事:我以为 Claude Code 是大头,但其实 Codex CLI 烧得更狠

原因是 Codex 是 Agent 模式跑——一次任务里模型循环调用很多次,单次会话累计上下文动辄百万 Token。而我用 Claude Code 主要是 chat 模式,一次几十万 Token 也就到顶。

如果不把它们摆在一起对比,我永远不会知道这件事。

不是只为了节省

把多个工具的消耗放一起看,最大价值不是省钱——虽然确实能省。最大价值是让你重新理解自己的工作方式

你会发现:

  • 你哪天用 AI 最猛(很可能是周二,不是你以为的周一)
  • 哪个项目最贵(往往是那个你以为"轻量"的辅助项目)
  • 哪个工具的输出最低效(cache 命中率低、output 比例高)

这些洞察 dashboard 给不了。装一下 Vibe Usage 把多工具消耗看到一处,你会重新认识自己。

相关阅读

相关阅读

如何统计多个 AI 编程工具的总 Token 消耗