3你好限制,你的克劳德代码限制去了哪里?一个28天的缓存Bug,以及鼓励你"谨慎使用"的官方回应。
4-17%.这是克劳德代码在过去一个月中的提示缓存命中率。正常水平为97-99%。
这意味着,当您恢复上一个会话时,Claude Code 不会重用以前处理的上下文,而是每次都从头处理所有内容,消耗的积分比正常值高 10 到 20 倍。你可能认为你在继续对话,但实际上,你每次都在开始一个全新的、全价的对话。

这些数据来自独立开发者ArkNill的代理监控。通过设置透明代理,他记录了Claude Code和Anthropic API之间的每一个请求,发现了至少两个客户端方向缓存错误,导致API服务器无法匹配缓存的对话前缀,迫使每轮重建一个完整代币。

上图显示了三个阶段的缓存命中率比较。在 v2.1.69 到 v2.1.89 版本(bug 期间 ) , 单机版的缓存命中率只有 4-17 % 。修复了v2.1.90版中的一个关键错误后,冷启动缓存命中率恢复到47-99.7 % 。到 v2.1.91,稳定的缓存命中率恢复到 97-99%。
图表中一个值得注意的细节:v2.1.90 中的范围相当宽(47% 到 99.7 % ) ,因为当会话刚刚恢复时缓存仍然需要"热身 " , 导致前几轮命中率较低,但很快恢复正常。在bug版本中,这种热身永远不会发生 — 缓存命中率始终保持在系统提示的14,500个令牌上,每次对话历史的全部内容都会被完全计费。
28天,20个版本
此错误不是在一个更新中引入并在下一个更新中修复的类型。根据npm注册表发布记录,引入该漏洞的v2.1.69版本于三月4日发布,修复该漏洞的v2.1.90版本于四月1日发布。其间有28天,跨越20个版本。

时间线揭示了一个诱人的细节。在三月四日引入该漏洞后,用户并没有立即大规模投诉。直到三月二十三日,投诉才大规模爆发,几乎三个星期之后。原因是,根据GitHub第41930期的分析,从三月13日到28日,Anthropic进行了2倍配额的实盘推广(非高峰时段翻倍 ) , 客观上掩盖了bug的影响。促销结束后,缓存漏洞消耗量恢复到正常计费基线,用户的配额瞬间"蒸发 " 。
Anthropic的反应并不迅速。三月月26日,在用户投诉爆发三天后,工程师Thariq Shihipar在其个人X账户上宣布,高峰时段限制(工作日凌晨5点至凌晨11点)已经收紧。三月30日,Anthropic在Reddit上承认“用户达到配额的速度远远超过了预期 ” , 并将其列为团队的首要任务。直到四月一日,团队成员莉迪亚·哈莉才公布了正式的调查结果。
在整个过程中,Anthropic没有发布任何博客文章、发送电子邮箱/邮件通知或更新状态页面。所有官方沟通都完全通过工程师的个人社交媒体帖子和Reddit的一些评论来完成。
您支付了多少钱,可以使用多多头时间?
GitHub 第 #41930 期收集了数百份用户报告。最极端的情况是最大20倍订阅用户(200美元/月 ) , 其5小时的滚动窗口在19分钟内完全消耗殆尽。最大5倍用户(100美元/月)报告说,他们的5小时窗口在90分钟内用完了。据The Letter Two报道,一些用户声称,一个简单的"你好"消耗了他们会话配额的13 % 。Discord上的一位用户20美元/月)提到,他的配额"每周一用完,周六才重置 " , 30天内只有12天的正常使用。

根据ArkNill的基准测试,在错误版本v2.1.89中,Max 20x计划的100%配额将在大约70分钟内耗尽。他还计算了50万个代币上下文会话的单个 - - 恢复操作的成本,大约为0.15美元,因为系统会完全重放整个上下文。
「你拿错了」
Lydia Hallie的调查证实了两点:第一,高峰时段限制确实有所收紧;第二,在100万代币范围内代币消费有所增加。她提到,团队修复了一些bug,但强调"没有一个bug导致收费过高 。 "
然后,她提出了四项节俭建议:
1.使用十四行诗4.6而不是Opus(Opus的消耗率约为两倍 ) ;
2.降低推理深度或在不需要深度推理时关闭扩展思维;
3.不要恢复超过一小时的多头空闲会话;而要启动一个新的会话;
4.设置环境变量 CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000 以限制上下文窗口大小。
没有提到任何形式的配额重置或赔偿。
AI播客主持人亚历克斯·沃尔科夫(Alex Volkov)将这一回应总结为“你持有它是错误的 ” , 指出Anthropic本身将100万代币币上下文设置为默认上下文,将Opus作为旗舰模型进行推广,并强调延伸思维是卖点,但现在建议付费用户不要使用这些功能。
所谓"不过度收费"的说法也与Claude Code自己的更新历史产生了紧张关系。就在Lydia响应的前一天,v2.1.90修复了一个自v2.1.69以来一直存在的缓存回归错误:当使用 - - resume恢复会话时,本应命中缓存的请求将触发完整的提示缓存未命中,从而导致全额计费。Lydia的答复没有提到这一确认的账单异常情况。

相比之下,OpenAI 的 Codex 以前也曾遇到过类似的异常配额消耗问题。OpenAI的做法是重新设置用户配额,发放到账退款,并在三月宣布取消Codex的使用上限。Anthropic的方法是建议用户降级模型、禁用功能、限制上下文并将责任归属于用户使用。
Anthropic 销售"最强模型+最大上下文+最高推理能力"的订阅,每月收费 20 到 200 美元。一个长达28天的缓存漏洞导致付费用户的配额以10-20倍的速度耗尽,官方的反应是谨慎使用。
猜你喜欢

历时两年,香港首批稳定币牌照终于落地:汇丰、渣打入围

帮TAO涨了90%的人,今天又亲手带崩了价格

3分钟看懂如何在Bitget参与SpaceX IPO

如何在2026年竞争币热潮来临前,利用闲置的USDT理财赚取15,000美元
想知道2026年是否会迎来竞争币行情?获取最新市场动态,了解如何将闲置的稳定币转化为最高达 15,000 USDT 的额外奖励。

2026年第一季度值得买入的五大加密货币:ChatGPT深度解析
了解2026年第一季度值得买入的五大加密货币,包括BTC、ETH、SOL、TAO和ONDO。了解影响下一轮市场走势的价格展望、核心观点及机构催化因素。

交易量不大也能获得 Joker Returns 的收益吗?WEEX Joker Returns 第二季新玩家常犯的 5 个错误
小额交易者能否在不进行巨额交易的情况下赢得 WEEX Joker Returns 2026?是的——只要你避免这5个代价高昂的错误。学习如何最大化抽牌次数,明智地使用百搭牌,并将小额存款转化为 15,000 USDT 奖励。

Alt赛季会在2026年到来吗?5提示现货未来100倍加密机会
竞争币的季节会在2026年到来吗?发现5个轮动阶段,智能交易者关注的早期信号,以及未来100倍竞争币机会可能出现的关键加密行业。

竞争币2026赛季:盈利的4个阶段(人群FOMO进入之前)
竞争币2026季即将开始 — — 发现资本轮动的4个关键阶段(从ETH到PEPE)以及如何在高峰前持仓。了解哪些令牌将引领每个阶段,避免错过集会。

熊市了,加密 ETF 发行商也卷起来了

这位首富与他的前老板发生了争执

创造SBTI测试的女孩:谈了场必死的赛博恋爱,一个失去电子丈夫的老鼠人

B.AI正式上线:构建AI Agent金融底层基座,驱动AGI时代商业底层逻辑

B.AI正式上线:破除A2A协作壁垒,以全景基建解锁智能体经济潜能

我们帮徐明星写了一本《OK人生》

罕见的费率年化400%,TradeXYZ在向石油做多者撒钱?

a16z:永续合约正在改写全球交易规则

a16z 合伙人:永续合约正在改写全球交易规则

2026年持币生息奖励:WEEX 对比币安 对比 Bybit 对比欧易 对比 Kraken(仅有一家额外支付)
持币生息 2026:币安?Bybit?没有额外奖励。只有WEEX提供+0.5% + 300%年化利率的邀请奖励。限时优惠。立即查看您还能多理财多少钱。
历时两年,香港首批稳定币牌照终于落地:汇丰、渣打入围
帮TAO涨了90%的人,今天又亲手带崩了价格
3分钟看懂如何在Bitget参与SpaceX IPO
如何在2026年竞争币热潮来临前,利用闲置的USDT理财赚取15,000美元
想知道2026年是否会迎来竞争币行情?获取最新市场动态,了解如何将闲置的稳定币转化为最高达 15,000 USDT 的额外奖励。
2026年第一季度值得买入的五大加密货币:ChatGPT深度解析
了解2026年第一季度值得买入的五大加密货币,包括BTC、ETH、SOL、TAO和ONDO。了解影响下一轮市场走势的价格展望、核心观点及机构催化因素。
交易量不大也能获得 Joker Returns 的收益吗?WEEX Joker Returns 第二季新玩家常犯的 5 个错误
小额交易者能否在不进行巨额交易的情况下赢得 WEEX Joker Returns 2026?是的——只要你避免这5个代价高昂的错误。学习如何最大化抽牌次数,明智地使用百搭牌,并将小额存款转化为 15,000 USDT 奖励。
