20K Tokens 是多少字?AI 编程一天用 100K 算多吗
看到 API 文档里的 20K、200K、1M context 总是没概念。这篇用具体类比把这些数字落地:20K 是一本短篇小说,1M 是《红楼梦》的 1.5 倍。AI 编程一天的"正常消耗"也讲清楚。
「我看了一下账单,今天烧了 87 万 Token」——这句话听上去要么很多要么很少,取决于你心里有没有一把尺子。多数人没这把尺子,所以经常走两个极端:要么觉得自己浪费要么觉得自己很省,但其实不知道。
这篇给你这把尺子。
把 Token 数翻译成你熟悉的东西
先建立基线。按中文一字 ≈ 1.9 Token、英文一词 ≈ 1.3 Token 来换算:
- 1K Token ≈ 500 个中文字 ≈ 750 个英文单词。一封比较长的邮件。
- 10K Token ≈ 5000 个中文字。一篇深度长文。
- 20K Token ≈ 1 万个中文字。一篇短篇小说。或者一份完整的产品需求文档。
- 50K Token ≈ 2.5 万字。一本薄书的一两章。
- 100K Token ≈ 5 万字。一本中等长度的实用书的核心章节。Claude 2 时代的最大上下文。
- 200K Token ≈ 10 万字。一本长篇小说。Claude 3 时代的最大上下文。
- 1M Token ≈ 50 万字。《红楼梦》全本(73 万字)的三分之二。Claude 4.6 / Gemini 1.5 / Sonnet 4.6 当代模型的最大上下文。
下次看到「128K context」别再对着抽象数字发呆。它就是一本书。
一天烧 100K 算多吗
直接给你一个对照表(基于近 30 天 Vibe Usage 上 368 个真实开发者的消耗分布):
| 你的日均 Token | 你的位置 |
|---|---|
| < 50 万 | 后 25%——非重度用户,可能是周末才写代码 |
| 50 万 - 200 万 | 中位数附近——典型轻度日常使用 |
| 200 万 - 500 万 | 中上——平时写代码,偶尔大任务 |
| 500 万 - 2000 万 | 前 25%——专业开发,重度依赖 AI |
| 2000 万 - 5000 万 | 前 10%——全天 AI 配合开发 |
| 5000 万 - 1 亿 | 前 5%——基本无 AI 不写代码 |
| > 1 亿 | 前 1%——团队主力 / 跑大量 Agent 任务 |
中位数是每天 467 万 Token——也就是说一半人每天烧不到 500 万。这比很多人以为的少。
如果你看到自己一天 100 万 Token 还在焦虑「是不是太多了」——你比一半的开发者用得少。如果你一天 5000 万——你已经是前 10% 的重度用户。
这些数据是哪来的
我在数据上有一手观察,是因为我在做 Vibe Usage 这个工具——它免费、本地、自动同步 Claude Code、Codex CLI、OpenCode 等工具的真实消耗。装它的开发者构成一个匿名样本池,我们在做聚合统计的时候得出上面这些数字。
注意:这是「装了 Vibe Usage 的开发者」的分布——本身就偏 AI 重度用户。如果你拿这个对比"全国所有程序员",会偏高。但拿来对比"已经在用 AI 编程工具的人",是相对准的样本。
一次任务大概烧多少
如果你想从任务粒度建立感觉:
- 写一个 React 组件 + 简单测试:5 万 - 30 万 Token。Claude Code chat 模式。
- 重构一个文件,加新参数 + 改用法 + 跑测试:20 万 - 100 万 Token。Claude Code Agent 模式。
- 跨多文件大重构(改 30+ 文件):200 万 - 2000 万 Token。Codex CLI Agent 模式。
- 全仓库迁移(升级 React 17 到 19 那种):5000 万 - 5 亿 Token。开 Codex 跑一晚上的级别。
最后那种事很多人做过一次就破防了——一晚上烧掉 50 美元。
1M Context 真的有用吗
近年的"百万上下文"模型——Gemini 1.5、Claude Sonnet 4.6 1M、最新的 Opus 4.7 1M——给人一种"我可以把整个项目都塞进去"的错觉。
实测下来,几个事实:
- 塞满 1M 上下文真的很贵。即使按缓存价计算,单次调用几美元起步。
- 模型在长上下文里的"针尖效应"明显——重要细节如果不在前段或末段,召回率会掉。
- 多数任务根本不需要 1M。只读 5-10 个相关文件就够了。
我装 Vibe Usage 看自己消耗的时候发现,超过 50 万 input Token 的会话占比不到 8%。也就是 92% 的工作根本用不到长上下文。这意味着追求 1M context 是个伪需求——你应该追求的是「精准给模型相关文件」。
把"多少算多"变成具体问题
「100K Token 算多吗」是一个无意义的问题。换成具体的:
- 「相比我自己上周——是多还是少?」
- 「相比同一任务的上一次执行——这次的消耗合不合理?」
- 「我同时用的几个工具——哪个占了大头?」
这些问题需要数据回答。把消耗放到 Vibe Usage 自己看一眼——免费、本地、装好就用。看到具体趋势之后,你会发现"消耗多不多"是个伪问题,"我消耗的钱花得值不值"才是真问题。