Anthropic说,新版Claude的tokenizer会让你的输入多花35%的token。
实测结果是:47%。
而且,这还是"加量不加价"的情况下发生的。
发生了什么
4月初,Anthropic发布了Claude Opus 4.7。
官方迁移指南轻描淡写地写了一句:新tokenizer"大约会增加1.0到1.35倍的token"。
一句话带过。
一个做Claude Code的开发者不干了。他叫了个真——用Anthropic自己的免费API POST /v1/messages/count_tokens,把同一段文字分别在4.6和4.7上跑了一遍。
结果傻眼了。
一个真实的CLAUDE.md文件(5KB),token从1,399涨到2,021。涨幅44.5%。
技术文档更离谱。英文技术文档,token涨了47%。
官方说的"1.35倍上限",在实际场景里像个笑话。
你的代码和文档,挨刀最狠
这个开发者测了12种内容类型,结果很残酷:
中文和日文,基本没涨。1.01倍,几乎等于没变。
英文,涨了20%到47%。
代码,涨了29%到39%。
最惨的是技术文档和Shell脚本,逼近50%的涨幅。
为什么?
新版tokenizer把同一个词拆得更细了。
原来4个字符一个token,现在3.6个字符一个token。TypeScript更夸张,从3.66降到2.69。
相当于把一句话切成更碎的渣子喂给模型。
模型确实能更精准地"看清"每个词,但也意味着——你交的每一笔钱,都在为更多的碎片付费。
算一笔账:80轮对话贵了多少
作者模拟了一个典型的Claude Code工作流:80轮对话,修一个bug或者重构代码。
包含这些固定开销:
- CLAUDE.md + 工具定义:每次都带着,约6K token
- 对话历史:每轮涨2K,到第80轮时累计160K
- 缓存命中率:95%(5分钟窗口内)
4.6时代,这一套下来大概6.65美元。
4.7时代,同样的对话,同样的token单价——
7.86到8.76美元。涨了20%到30%。
而且这还是保守估计。如果Claude 4.7的xhigh模式产生更多思考token,账单还会更难看。
一个冷知识:你的缓存不是无缝迁移的。从4.6切到4.7,所有缓存失效。第一次跑新模型时,写缓存的钱也要按新tokenizer算。
等于冷启动更贵,长期跑更贵,哪里都省不了。
涨了这些,换来了什么
Anthropic的说法是:新tokenizer能带来"更严格的指令遵循"。
实测怎么说?
作者用IFEval基准测了20个提示。IFEval是Google 2023年搞的,专门测模型有多"听话"——比如"精确用N个词回答""某个词出现两次""不要逗号"这种变态要求。
结果:
- 严格模式下,4.6答对85%,4.7答对90%
- 宽松模式下,两者都是90%
涨了5个百分点。
对,就5%。
而且这5%可能还不是tokenizer的功劳——模型权重和训练方式也变了。tokenizer只是"可能"的贡献因素之一。
一个不严谨的比喻:
你多付了30%的钱,买了一瓶标注"可能改善5%性能"的汽水。
有人早就看穿了
评论里有个比喻特别到位:
"加尔各答的甜品商贩在原料涨价后,不敢提价,就悄悄把甜品做小了。顾客慢慢接受了更小的尺寸,市场也习以为常。"
AI行业正在发生一模一样的事。
模型能力提升放缓,训练成本下不来,定价又不能涨。
怎么办?
把同样的内容切成更多token。
用户觉得"我没多花钱啊"。
账单不说话。
所以,值得升级吗?
这取决于你怎么用Claude。
如果你主要让它读中文文档、查表格、处理JSON——基本没影响,1.01倍的token增长可以忽略。
如果你重度依赖它写代码、读技术文档、频繁修改CLAUDE.md——做好涨30%的准备。
好消息是Claude 4.6和Sonnet 4.6都没下架。Anthropic没有强制你升级。
坏消息是,这种"悄悄涨token"的做法,可能只是开始。
当性能提升进入瓶颈期,成本压力又会找到下一个出口。
【锐评】: 4.7用47%的token涨幅换了5%的指令遵循提升,这买卖 Anthropic 怎么算怎么赚,用户怎么算怎么亏。所谓的"加量不加价",不过是把账单拆成了更多行而已。
参考链接:
https://www.claudecodecamp.com/p/i-measured-claude-4-7-s-new-tokenizer-here-s-what-it-costs-you