2026 年 2 月 5 日Claude CodeCodex CLIGemini CLIOpenCode

如何统计多个 AI 编程工具的总 Token 消耗

你同时用 Claude Code、Codex CLI、Gemini CLI 三个工具，每个工具的消耗都散落在不同地方——这篇讲清各工具自带统计的局限，以及一个能把它们统一起来的办法。

我电脑上同时装了 Claude Code、Codex CLI、Gemini CLI、OpenCode 四个工具。每个都好用，每个都有适合的场景，但有一件事让我抓狂：我不知道这四个工具加起来到底烧了多少 Token。

每个工具的统计入口都不一样，格式不一样，时间窗口不一样，单位也不一样。这篇讲清这件事的现状、各工具自带统计的天花板，以及怎么把数字加起来。

各工具自带统计长什么样

先说一遍各工具能告诉你什么。

Claude Code 有个 /cost 命令。在会话里输入它，会打出当前 session 的 input/output/cached 各类 Token 数和估算费用。但它只看当前 session——你昨天那场会话已经看不到了。如果想看跨会话统计，得自己去翻 ~/.claude/projects/ 下面的 jsonl 文件，自己解析。

Codex CLI 比较好一点。codex usage 子命令能看到本周和本月汇总。但它只看 OpenAI 一家，而且只有 input/output 两个数字，不细分模型。

Gemini CLI 几乎没有自带统计。你只能去 Google Cloud Console 的 API 计量页面看，颗粒度按天，没法按项目区分。

OpenCode 输出每次调用都打印 Token 数到 stderr，但没有汇总。如果想统计今天用了多少，你要么开 telemetry 写到日志再自己解析，要么用 Provider 的 dashboard。

四个工具，四套口径，对账完全是噩梦。

凑数据的笨办法

我一开始的笨办法是这样的：

每周日晚上花半小时，挨个打开各家的 dashboard 截图，再抄到一个 Google Sheet 里。Anthropic 的 Console、OpenAI 的 Usage 页、Google Cloud 的 Billing。光打开这几个页面就要登录三次。

这样做了三周我就放弃了。两个原因：

第一，口径对不上。Anthropic 给的是按 API key、按天的 Token 数，OpenAI 给的是按模型、按小时的 Token 数。我没法把它们按"项目"或"工作内容"对齐。

第二，没法看趋势。最有用的问题——这周的消耗比上周高了多少？高在哪个工具上？哪个项目花最多？——dashboard 都答不出来。

把它们扔到一个地方看

后来我发现一个简单的事实：所有这些工具的真实消耗其实都已经写在你电脑的本地日志里了——Claude Code 写在 ~/.claude/projects/，Codex 写在 ~/.codex/sessions/，Gemini 写在 ~/.gemini/，OpenCode 写在 ~/.config/opencode/。

只要有个东西能定时扫这些目录、解析格式、汇总到一起，你就有了完整画面。

我现在用的就是 Vibe Usage。免费，跑在本地，自动读各工具的日志文件，把所有消耗按天、按工具、按模型、按项目汇总。我装好之后什么都没配——它自己识别我装了哪些工具，自动开始同步。

最让我满意的是它的"对比视图"——同一时间段，Claude Code 烧了多少、Codex 烧了多少、各自占比多少，一眼就能看出哪个工具是大头、最近哪个项目突然冒尖。

一个反直觉的发现

装上之后第一周，我就看到一个意外的事：我以为 Claude Code 是大头，但其实 Codex CLI 烧得更狠。

原因是 Codex 是 Agent 模式跑——一次任务里模型循环调用很多次，单次会话累计上下文动辄百万 Token。而我用 Claude Code 主要是 chat 模式，一次几十万 Token 也就到顶。

如果不把它们摆在一起对比，我永远不会知道这件事。

不是只为了节省

把多个工具的消耗放一起看，最大价值不是省钱——虽然确实能省。最大价值是让你重新理解自己的工作方式。

你会发现：

你哪天用 AI 最猛（很可能是周二，不是你以为的周一）
哪个项目最贵（往往是那个你以为"轻量"的辅助项目）
哪个工具的输出最低效（cache 命中率低、output 比例高）

这些洞察 dashboard 给不了。装一下 Vibe Usage 把多工具消耗看到一处，你会重新认识自己。