中文提示词 vs 英文提示词:Token 消耗到底差多少
同样意思的一句话,中文消耗的 Token 比英文多 1.5 到 2 倍。这意味着你写中文 prompt 比写英文贵——但意外的是,把项目说明改成英文后我账单只降了 12%。这篇讲清原因。
「同样意思中文比英文费 Token」是个老生常谈。我之前也信,于是有一段时间把所有 prompt、CLAUDE.md、AGENTS.md 都翻成英文——结果账单只降了 12%。
这篇讲清"中英 Token 差异"实际有多大、为什么真实节省没有理论值高,以及什么时候该用中文什么时候该用英文。
理论上的 Token 差异
主流切词器对中英效率:
- 英文:约 1.3 个 Token / 单词,约 0.25 个 Token / 字符
- 中文:约 1.9 个 Token / 字(生僻字 2-3 个)
把同一句话翻译过来:
- "Refactor this function to support pagination" — 8 个英文单词 → 约 10 Token
- 「将这个函数重构成支持分页的版本」— 17 个汉字 → 约 32 Token
中文是英文的 3.2 倍。这个倍数是真的。
但这只是"你打的字"那一段。
真实 input 里你打的字只占 0.1%-1%
如前文反复强调,一次 Claude Code 调用的 input Token 大概是这样分布:
- 系统提示 + 工具说明:5-10K Token
- CLAUDE.md / AGENTS.md:1-10K Token(你写多长就多长)
- 历史对话和工具调用结果:50K-500K Token
- 当前消息:30-300 Token
你当前消息那部分是中英差异最大的——但它在总 input 里占比 0.1%-1%。即使把它从中文翻成英文省 60%,对总账单的影响是 0.6%-6%。
真正能用中英差异省钱的部分,是 CLAUDE.md / AGENTS.md / 系统提示这种长期复用、被纳入每次 input 的内容。
我把项目说明翻成英文之后
我做了一个实验:把一个项目的 AGENTS.md(中文 5800 字)翻成英文(约 920 单词)。
理论计算:
- 中文:5800 × 1.9 ≈ 11000 Token
- 英文:920 × 1.3 ≈ 1200 Token
理论节省:每次 input 省 9800 Token。按 Sonnet input 价 3 美元/百万 = 0.03 美分/次。如果每天 200 次调用,月省 1.8 美元。
但实际数据:账单一个月降了 18 美元。差距来自:
- 缓存命中——绝大多数 input 走 cached 价格(10% 原价),实际节省是理论值的 1/10。
- AGENTS.md 改完缓存重建——优化的第一周缓存全部冷启动,部分对冲了节省。
最终月省 12%——比理论低不少,但仍然值。
但翻完英文之后我又翻回去了
3 个月后我把那份 AGENTS.md 翻回中文。原因不是 Token——是写作和维护成本。
英文版我每次更新一个项目细节,要多想一会儿——写中文是脱口而出的事,写英文要想措辞、要用对术语。一个月后维护节奏变慢了。
省的 18 美元 / 月,换我每月多花 2 小时纠结英文表达——按时薪算我亏了。
什么时候用英文真的值
不是所有项目都不值。三种情况下英文是对的:
1. 你团队本来就讲英文
国际化团队、面向英文用户的产品,英文 prompt 维护成本最低。中英 Token 差异是 bonus。
2. 高频复用、长 prompt
如果你的 system prompt 是 2 万 Token 中文,每天被调用 1000 次——这种情况翻英文一个月能省 100+ 美元。值。
3. 模型对英文的理解明显更好
某些任务上模型的英文表现确实超过中文。代码注释、技术文档、规范化任务这种场景,英文输出质量更高。
什么时候用中文是对的
1. 你思考时是中文
强行翻英文写 prompt 会损失精度。你想表达"这个函数有点花哨",中文是直觉,英文要去想 "fancy"、"over-engineered"、"convoluted" 哪个对——多花的脑力比省的 Token 贵。
2. 项目说明长期不变
只要不动,缓存一直命中——中文消耗实际只是 10% 原价。差异微乎其微。
3. 跟中文母语者协作
AGENTS.md / CLAUDE.md 不光是写给 AI 看的,也是写给同事看的。同事看英文累,那就别勉强。
实测建议
如果你想搞清楚"中英差异对自己账单的真实影响"——
把 Vibe Usage 装上,记下当前一周的总 Token 数。然后把你最长的那份 AGENTS.md 翻成英文(用 Claude 翻一下就行),下一周对比 Token 数。
我自己做这个实验花了 30 分钟翻译 + 一周观察。比看任何文章都直接。
一个反共识结论
「写英文 prompt 省钱」这个建议传太广,多数情况下被高估了。对个人开发者来说,省下来的钱抵不过维护成本提高的工时损失。
只有当你的 prompt 满足"非常长 + 高频被使用 + 完全静态"三个条件时,翻英文才值。这种条件不算稀有,但也不是普通人日常项目的常态。
不要被「中文费 Token」吓住——你的实际损失可能 1 美元 / 月不到。把精力花在缓存命中率、output 控制这些大头上。