Anthropic说,新版Claude的tokenizer会让你的输入多花35%的token。

实测结果是:47%。

而且,这还是"加量不加价"的情况下发生的。

发生了什么

4月初,Anthropic发布了Claude Opus 4.7。

官方迁移指南轻描淡写地写了一句:新tokenizer"大约会增加1.0到1.35倍的token"。

一句话带过。

一个做Claude Code的开发者不干了。他叫了个真——用Anthropic自己的免费API POST /v1/messages/count_tokens,把同一段文字分别在4.6和4.7上跑了一遍。

结果傻眼了。

一个真实的CLAUDE.md文件(5KB),token从1,399涨到2,021。涨幅44.5%。

AI配图

技术文档更离谱。英文技术文档,token涨了47%。

官方说的"1.35倍上限",在实际场景里像个笑话。

你的代码和文档,挨刀最狠

这个开发者测了12种内容类型,结果很残酷:

中文和日文,基本没涨。1.01倍,几乎等于没变。

英文,涨了20%到47%。

代码,涨了29%到39%。

最惨的是技术文档和Shell脚本,逼近50%的涨幅。

为什么?

新版tokenizer把同一个词拆得更细了。

原来4个字符一个token,现在3.6个字符一个token。TypeScript更夸张,从3.66降到2.69。

相当于把一句话切成更碎的渣子喂给模型。

模型确实能更精准地"看清"每个词,但也意味着——你交的每一笔钱,都在为更多的碎片付费。

算一笔账:80轮对话贵了多少

作者模拟了一个典型的Claude Code工作流:80轮对话,修一个bug或者重构代码。

包含这些固定开销:

  • CLAUDE.md + 工具定义:每次都带着,约6K token
  • 对话历史:每轮涨2K,到第80轮时累计160K
  • 缓存命中率:95%(5分钟窗口内)

4.6时代,这一套下来大概6.65美元。

4.7时代,同样的对话,同样的token单价——

7.86到8.76美元。涨了20%到30%。

而且这还是保守估计。如果Claude 4.7的xhigh模式产生更多思考token,账单还会更难看。

一个冷知识:你的缓存不是无缝迁移的。从4.6切到4.7,所有缓存失效。第一次跑新模型时,写缓存的钱也要按新tokenizer算。

等于冷启动更贵,长期跑更贵,哪里都省不了。

涨了这些,换来了什么

Anthropic的说法是:新tokenizer能带来"更严格的指令遵循"。

实测怎么说?

作者用IFEval基准测了20个提示。IFEval是Google 2023年搞的,专门测模型有多"听话"——比如"精确用N个词回答""某个词出现两次""不要逗号"这种变态要求。

结果:

  • 严格模式下,4.6答对85%,4.7答对90%
  • 宽松模式下,两者都是90%

涨了5个百分点。

AI配图

对,就5%。

而且这5%可能还不是tokenizer的功劳——模型权重和训练方式也变了。tokenizer只是"可能"的贡献因素之一。

一个不严谨的比喻:

你多付了30%的钱,买了一瓶标注"可能改善5%性能"的汽水。

有人早就看穿了

评论里有个比喻特别到位:

"加尔各答的甜品商贩在原料涨价后,不敢提价,就悄悄把甜品做小了。顾客慢慢接受了更小的尺寸,市场也习以为常。"

AI行业正在发生一模一样的事。

模型能力提升放缓,训练成本下不来,定价又不能涨。

怎么办?

把同样的内容切成更多token。

AI配图

用户觉得"我没多花钱啊"。

账单不说话。

所以,值得升级吗?

这取决于你怎么用Claude。

如果你主要让它读中文文档、查表格、处理JSON——基本没影响,1.01倍的token增长可以忽略。

如果你重度依赖它写代码、读技术文档、频繁修改CLAUDE.md——做好涨30%的准备。

好消息是Claude 4.6和Sonnet 4.6都没下架。Anthropic没有强制你升级。

坏消息是,这种"悄悄涨token"的做法,可能只是开始。

当性能提升进入瓶颈期,成本压力又会找到下一个出口。

【锐评】: 4.7用47%的token涨幅换了5%的指令遵循提升,这买卖 Anthropic 怎么算怎么赚,用户怎么算怎么亏。所谓的"加量不加价",不过是把账单拆成了更多行而已。

参考链接:
https://www.claudecodecamp.com/p/i-measured-claude-4-7-s-new-tokenizer-here-s-what-it-costs-you