Anthropic 的程式碼輔助開發工具 Claude Code,憑藉著強大的專案上下文理解與優秀的 AI Agentic(AI 代理人)開發能力,一推出就深受許多工程師喜愛。然而,在 2026 年 3 月底到 4 月初這段期間,全球開發者社群(包含 GitHub、Hacker News 與 Reddit)卻爆發了強烈的炎上與抗議聲浪。
這場風暴的導火線,來自於 GitHub 上的一篇高熱度討論:[BUG] Pro Max 5x Quota Exhausted in 1.5 Hours Despite Moderate Usage (#45756)(即使是中度使用,Pro Max 5x 的額度仍在 1.5 小時內耗盡)。
許多每月花費 100 美金(約台幣 3,200 元)訂閱 Max 5x 方案的進階開發者驚覺,原本標榜能支撐高強度開發的配額,竟然在短短 90 分鐘內就被強制榨乾。在各方社群研究之下,才發現這一切竟然與官方的暗改機制以及長達 28 天未修復的底層 Bug 有關。
消失的額度,一聲 Hello 吃掉 13% 配額?
為了應付大型專案對上下文視窗(Context Window)的極大需求,許多重度開發者都會選擇升級到 Claude Code 的高階方案。
然而在 Issue #45756 與 Hacker News 的熱烈討論串(id=47739260) 中,大量苦主出面抱怨配額光速蒸發的慘況。有使用者無奈表示:「我只是用 Python 標準函式庫寫點基礎程式,30 分鐘內配額就被用光光了。」更誇張的是,在 Discord 與 Reddit 社群中,有 Pro 用戶實測發現,在某個舊會話中僅僅只是發送一句 Hello,竟然就瞬間蒸發了 13% 的會話額度。
面對異常消耗,開發者們沒有坐以待斃。許多開發者們試著去研究 Claude Code 的 JSONL 本機日誌與 API 封包,結果抓到了導致配額快速蒸發的兩大技術元兇。
真兇是快取 Bug 與官方暗改TTL 壽命
1、長達 28 天的快取失效 Bug(Cache Busting)
在 Reddit 的 r/ClaudeCode 版上,有神人網友透過逆向工程與設立透明代理(Transparent Proxy)攔截 API 請求,發現 Claude Code 存在嚴重的快取 Bug。
自 3 月 4 日釋出的 v2.1.69 版本開始,獨立執行檔(Standalone binary)中的特定字串替換機制,以及使用 –resume 恢復舊對話時的索引錯誤,會導致 Anthropic 伺服器無法比對快取前綴。
影響有多大? 正常情況下,快取命中率(Cache read rate)應該在 97%~99%,但受 Bug 影響,命中率慘跌至 4%~17%。
成本暴增: 重新建立快取(cache_creation)的 Token 成本是讀取快取的 10 到 20 倍。這意味著,你每次下指令,Claude Code 都被迫將數以萬計的對話歷史與系統提示詞以「原價」重新計費,導致配額瞬間大失血。
2、官方偷改快取存活時間 (TTL) 從 1 小時大砍至 5 分鐘
除了 Bug 之外,社群在另一個深度追蹤的 Issue #46829 中,發現 Anthropic 在 3 月 6 日左右,悄悄將提示詞快取(Prompt Cache)的預設存活時間(TTL)從 1 小時大幅縮短到了 5 分鐘。
這對開發者來說是不利的,因為 TTL 只有 5 分鐘,只要你停下來思考邏輯、喝杯水或回個 Slack 訊息,上一次建立的昂貴快取就會全數過期。下一次送出訊息時,又得重新支付高昂的快取建立費用。
官方提油救火引發社群非議
面對排山倒海的客訴,Anthropic 官方人員在 Issue #46829 中的回應卻宛如提油救火。官方承認將 TTL 縮減為 5 分鐘是「故意的(Intentional)」,目的是為了最佳化快取與節省伺服器記憶體。當被問及是否能恢復 1 小時時,官方明確拒絕,隨後便將該 Issue 標記為 Closed as not planned(未計畫修復)並關閉。
此外,官方團隊(如 Lydia Hallie)出面澄清沒有單一 Bug 會導致如此龐大的額外收費,並發布了幾項節省額度的官方建議,比方說,避免長時間閒置後恢復舊會話、調低思考強度等。
這種將官方伺服器記憶體成本,變相轉嫁給使用者配額的作法,以及要求付費用戶省點用的態度,讓開發社群怒火中燒。許多網友怒批這根本是科技界的縮水式通膨(Shrinkflation)。在 Hacker News 上,許多開發者表示已經取消了 Anthropic 的高階方案,轉而將主力工作流切換回額度更透明的 Cursor 或是 OpenAI Codex。
給台灣開發者的避雷自救指南
雖然官方在 4 月初釋出的 v2.1.90 與 v2.1.91 版本中已陸續修復了導致快取命中率低下的核心 Bug,但 TTL 被縮短為 5 分鐘已成定局。如果你目前仍重度依賴 Claude Code 工作,CyberQ 建議參考以下幾招自救方案來止血。
當不知道自己的使用額度情形,請先看這一篇 claude-usage 破解 Claude 用量盲盒,近期配額災情與生態觀察,安裝這個外掛程式來掌握自己的額度。
首先是改用 NPM 版本安裝,避免使用官方提供的獨立執行檔(install.sh)。透過 Node.js 環境執行 npx @anthropic-ai/claude-code,可以避開部分底層寫死(hardcoded)的字串替換 Bug。
接著確保更新至最新版,請檢查你的 Claude Code 版本,務必升級至 v2.1.91 或以上版本,確保快取命中率回到 97% 以上的正常水準。
戒掉 –resume,適時清空記憶,這是因為在 5 分鐘 TTL 的限制下,恢復閒置超過一小時的長對話非常不划算。與其讓 AI 重新載入龐大的無效歷史,不如適時使用 /clear 或 /compact 重新建立乾淨的工作對話。
改用 Sonnet 4.6 模型也是一個方式,官方指出 Opus 模型的消耗速率大約是 Sonnet 的兩倍。針對一般的重構與除錯任務,切換到 Sonnet 4.6 能大幅延長配額的存活時間。
限制上下文視窗記得設定,我們可以在終端機設定環境變數 export CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000,強制限制過大的上下文,避免單次請求燒掉過多 Token。
CyberQ 認為,Claude Code 雖然對開發者來說真的很好用,但這次 #45756 事件其實說到底,當我們將生產力高度依賴於不透明計費的雲端 AI 服務時,官方一個伺服器端的小偷改,就能讓開發者的工作流癱瘓。未來這類工具如何在商業擴展成本與使用者體驗信任間取得平衡,我們就等 Anthropic 給大家答案囉。







