1 token 是多少字、多少钱?100 万 token 换算速查表
1 token 大约等于 0.6 个汉字或 0.75 个英文单词,但你真正想知道的是 token 换成钱和字是多少。这篇给一张速查表:20K、100K、100 万 token 分别是多少字、值多少钱,再用真实数据告诉你一天烧 100 万 token 在所有用户里算多还是少。
1 token 大约是 0.6 个汉字、0.75 个英文单词;反过来,1 个汉字约等于 1.5-2 个 token,1 个英文单词约 1.3 个 token。但你搜「1 token 是多少字」多半不是想要这个比例,而是想把屏幕上那个吓人的 token 数换算成"多少字、多少钱"。这篇直接给速查表。
token ↔ 字数速查
按中英文混排的常见情况估算(纯中文偏上限,纯代码偏下限):
| token 数 | 约等于汉字 | 约等于英文单词 | 直观参照 |
|---|---|---|---|
| 1K | 600 字 | 750 词 | 一条长消息 |
| 20K | 1.2 万字 | 1.5 万词 | 一篇长文 / 几个源文件 |
| 100K | 6 万字 | 7.5 万词 | 一本中篇小说 |
| 100 万(1M) | 60 万字 | 75 万词 | 一部长篇巨著 |
所以「1M 上下文」大概能塞下 60 万汉字——一整本《红楼梦》还有富余。这也是为什么大上下文窗口看着诱人,但真塞满了既慢又贵。
token ↔ 钱速查
token 换成钱要分 input 和 output,两者差好几倍,还得看走不走缓存。按当前主流模型的量级给个区间(以人民币粗算,汇率和单价会变,看数量级即可):
| token 数 | 纯 input(未缓存) | 纯 output |
|---|---|---|
| 20K | 几分到一两毛 | 几毛 |
| 100K | 一两毛到几毛 | 一两块 |
| 100 万 | 一两块到几块 | 一二十块 |
两个关键点决定你实际付多少:
第一,output 比 input 贵好几倍。 同样 100 万 token,全是 input 可能就几块钱,全是 output 能到一二十。好在写代码场景里 output 占比很低——我看真实数据,Codex 的 output / input 只有 4%,Claude Code 6%。绝大多数 token 是 input。
第二,缓存能把 input 砍到 10%。 命中缓存的 input 只按全价的 10% 计费。Claude Code 用户缓存命中率中位数 91%,意思是绝大部分 input 实际只花了一折的钱。所以同样烧 100 万 token,命中率 90% 的人和 50% 的人,账单能差出好几倍——你的命中率多少,Vibe Usage 一眼能看到。
一天烧 100 万 token 算多吗
知道了换算,下一个问题通常是:「我一天 100 万 token,多不多?」
把 368 个真实用户的日均 token 排个序:中位数是 467 万 / 天。所以一天 100 万其实偏少,你比一半以上的人都省。日均到 3700 万才算前 10%,到 2.5 亿才是前 1%。
那些晒"一天 1 亿 token"截图的,是 200 倍于普通人的极端用户,不是你该比的基线。
想看自己换算成钱是多少
速查表给的是量级。你自己一个月烧了多少 token、按当前单价折多少钱、缓存命中率拉低了多少——这些只有看自己的真实数据才准。
打开 Vibe Usage 看自己的 token 换算成钱是多少,它免费、本地,自动把你各个工具的 token 按当前单价折成费用,还告诉你缓存帮你省了多少。比对着速查表心算靠谱得多。