您现在的位置是: > 快讯快讯

Claude Code缓存Bug致额度蒸发20倍,币安官网注册用户可关注AI算力投资动态

zhoucl 2026-04-03 19:22:43 快讯 已有人查阅

导读Claude Code因缓存机制缺陷导致用户额度消耗飙升10至20倍,官方回应却建议‘省着点用’。该事件引发开发者强烈不满。对于关注AI算力与区块链技术融合的投资者,可通过币安官网注册并下载币安app,实时追踪相关数字资产动态,把握前沿科技投资机会。

过去一个月,Claude Code的prompt cache读取率仅为4-17%,远低于正常水平的97-99%。这意味着用户每次恢复会话时,系统并未复用已有上下文,而是从头处理全部内容,导致token消耗激增,实际支出为正常情况的10到20倍。你自以为在延续对话,实则每轮都在进行全价重算。

这一数据由独立开发者ArkNill通过透明代理监控得出。他记录了Claude Code与Anthropic API之间的所有请求,发现至少存在两个客户端缓存问题,致使服务器无法匹配已缓存的对话前缀,被迫执行完整token重建。

图表显示三个阶段的缓存表现:在v2.1.69至v2.1.89版本期间(即漏洞持续期),standalone版本的缓存命中率仅4-17%;修复关键问题后的v2.1.90版本,冷启动缓存命中率回升至47-99.7%;至v2.1.91,稳定运行下恢复至97-99%的正常水平。

值得注意的是,v2.1.90阶段的跨度较大,是因为新会话需“预热”缓存,初期命中率偏低,但迅速上升。而在漏洞版本中,这种预热从未发生——缓存始终停留在系统提示词的14,500 token上,所有历史对话均按全额计费。

28天,20个版本

此漏洞并非一次性引入、一次修复的典型问题。根据npm registry发布记录,引入该问题的v2.1.69版本于3月4日上线,修复版本v2.1.90发布于4月1日,历时28天,横跨20个版本迭代。

时间线揭示一个耐人寻味的现象:3月4日漏洞上线后,用户未立即大规模投诉。直到3月23日才集中爆发,中间间隔近三周。原因在于3月13日至28日,Anthropic曾推出2倍额度促销(off-peak时段翻倍),客观上掩盖了漏洞带来的高消耗影响。促销结束后,真实计费基线暴露,用户额度瞬间“蒸发”。

Anthropic的回应迟缓。3月26日,工程师Thariq Shihipar在个人X账号宣布高峰时段限额收紧;3月30日,其在Reddit承认“用户触达限额速度远超预期”,称已列为最高优先级。直至4月1日,团队成员Lydia Hallie才发布正式调查结论。

整个过程无博客文章、无邮件通知、无状态页更新,所有沟通依赖工程师个人社交媒体和少数Reddit评论,信息透明度严重不足。

你付了多少钱,能用多久?

GitHub issue #41930汇集数百条用户报告。极端案例显示,一位Max 20x订阅用户($200/月)的5小时滚动窗口在19分钟内耗尽;Max 5x用户($100/月)报告5小时窗口90分钟内用完。据The Letter Two报道,甚至一条简单的“hello”就消耗13%的会话配额。一位Pro用户($20/月)在Discord称:“每周一就用完,周六才重置,30天里只有12天能正常使用。”

ArkNill基准测试显示,在漏洞版本v2.1.89下,Max 20x计划的100%配额约70分钟内耗尽。他还测算,单次--resume操作对50万token上下文会话的成本约为$0.15,因系统需完整重放整个上下文。

「你拿的方式不对」

Lydia Hallie的调查确认两点:一是高峰时段限额已收紧,二是100万token上下文会话消耗增大。她称团队修复部分bug,但强调“没有任何一个bug导致多收费”。

随后她提出四条“省量建议”:

  • 使用Sonnet 4.6而非Opus(Opus消耗速度约为两倍);
  • 无需深度推理时降低推理强度或关闭extended thinking;
  • 闲置超过一小时的长会话不要恢复,重新开启;
  • 设置环境变量CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000以限制上下文窗口大小。
  • 未提及任何额度重置或补偿措施。

    AI播客主持人Alex Volkov将此回应概括为“你拿的方式不对”(You're holding it wrong),指出Anthropic自身将100万token上下文设为默认、推广Opus模型、宣传extended thinking功能,如今却建议付费用户放弃这些核心优势。

    “没有多收费”的说法与自身更新记录存在矛盾。就在Lydia发布回应前一天,v2.1.90修复了一个自v2.1.69起存在的缓存回归问题:使用--resume恢复会话时,本应命中缓存的请求触发完整prompt cache miss,按全价计费。而该异常在回应中未被提及。

    对照来看,OpenAI此前也出现类似额度异常问题。其做法是重置用户配额、补发credits,并于3月宣布移除Codex使用上限。Anthropic则建议用户降级模型、关闭功能、限制上下文,且将责任归因于用户使用方式。

    Anthropic销售的是“最强模型 最大上下文 最高推理能力”的订阅服务,定价每月20至200美元。一个横跨28天的缓存漏洞使付费用户额度以10至20倍速度蒸发,官方回应却是“请省着点用”。

    随着人工智能基础设施成本持续上升,相关算力资产正成为数字投资新焦点。对于希望布局前沿科技赛道的投资者,可通过官网,快速完成登录,或币安安卓APP,获取实时行情与链上数据分析。币安作为全球领先的加密交易平台,支持多种数字资产交易,提供安全、高效的区块链服务,是参与AI 区块链生态投资的理想入口。同时,官网也提供类似服务,用户可参考官网或欧易app体验,拓展选择视野。

    本文标签:

    很赞哦! ()