月繳 3,000 台幣卻撐不到兩小時？Claude Code 爆發吃額度災情，官方偷改 TTL + 致命 Bug 惹怒開發者

Anthropic 的程式碼輔助開發工具 Claude Code，憑藉著強大的專案上下文理解與優秀的 AI Agentic（AI 代理人）開發能力，一推出就深受許多工程師喜愛。然而，在 2026 年 3 月底到 4 月初這段期間，全球開發者社群（包含 GitHub、Hacker News 與 Reddit）卻爆發了強烈的炎上與抗議聲浪。

這場風暴的導火線，來自於 GitHub 上的一篇高熱度討論：[BUG] Pro Max 5x Quota Exhausted in 1.5 Hours Despite Moderate Usage (#45756)（即使是中度使用，Pro Max 5x 的額度仍在 1.5 小時內耗盡）。

許多每月花費 100 美金（約台幣 3,200 元）訂閱 Max 5x 方案的進階開發者驚覺，原本標榜能支撐高強度開發的配額，竟然在短短 90 分鐘內就被強制榨乾。在各方社群研究之下，才發現這一切竟然與官方的暗改機制以及長達 28 天未修復的底層 Bug 有關。

消失的額度，一聲 Hello 吃掉 13% 配額？

為了應付大型專案對上下文視窗（Context Window）的極大需求，許多重度開發者都會選擇升級到 Claude Code 的高階方案。

然而在 Issue #45756 與 Hacker News 的熱烈討論串（id=47739260）中，大量苦主出面抱怨配額光速蒸發的慘況。有使用者無奈表示：「我只是用 Python 標準函式庫寫點基礎程式，30 分鐘內配額就被用光光了。」更誇張的是，在 Discord 與 Reddit 社群中，有 Pro 用戶實測發現，在某個舊會話中僅僅只是發送一句 Hello，竟然就瞬間蒸發了 13% 的會話額度。

面對異常消耗，開發者們沒有坐以待斃。許多開發者們試著去研究 Claude Code 的 JSONL 本機日誌與 API 封包，結果抓到了導致配額快速蒸發的兩大技術元兇。

真兇是快取 Bug 與官方暗改TTL 壽命

1、長達 28 天的快取失效 Bug（Cache Busting）

在 Reddit 的 r/ClaudeCode 版上，有神人網友透過逆向工程與設立透明代理（Transparent Proxy）攔截 API 請求，發現 Claude Code 存在嚴重的快取 Bug。

自 3 月 4 日釋出的 v2.1.69 版本開始，獨立執行檔（Standalone binary）中的特定字串替換機制，以及使用 –resume 恢復舊對話時的索引錯誤，會導致 Anthropic 伺服器無法比對快取前綴。

影響有多大？正常情況下，快取命中率（Cache read rate）應該在 97%~99%，但受 Bug 影響，命中率慘跌至 4%~17%。

成本暴增：重新建立快取（cache_creation）的 Token 成本是讀取快取的 10 到 20 倍。這意味著，你每次下指令，Claude Code 都被迫將數以萬計的對話歷史與系統提示詞以「原價」重新計費，導致配額瞬間大失血。

2、官方偷改快取存活時間 (TTL) 從 1 小時大砍至 5 分鐘

除了 Bug 之外，社群在另一個深度追蹤的 Issue #46829 中，發現 Anthropic 在 3 月 6 日左右，悄悄將提示詞快取（Prompt Cache）的預設存活時間（TTL）從 1 小時大幅縮短到了 5 分鐘。

這對開發者來說是不利的，因為 TTL 只有 5 分鐘，只要你停下來思考邏輯、喝杯水或回個 Slack 訊息，上一次建立的昂貴快取就會全數過期。下一次送出訊息時，又得重新支付高昂的快取建立費用。

官方提油救火引發社群非議

面對排山倒海的客訴，Anthropic 官方人員在 Issue #46829 中的回應卻宛如提油救火。官方承認將 TTL 縮減為 5 分鐘是「故意的（Intentional）」，目的是為了最佳化快取與節省伺服器記憶體。當被問及是否能恢復 1 小時時，官方明確拒絕，隨後便將該 Issue 標記為 Closed as not planned（未計畫修復）並關閉。

此外，官方團隊（如 Lydia Hallie）出面澄清沒有單一 Bug 會導致如此龐大的額外收費，並發布了幾項節省額度的官方建議，比方說，避免長時間閒置後恢復舊會話、調低思考強度等。

這種將官方伺服器記憶體成本，變相轉嫁給使用者配額的作法，以及要求付費用戶省點用的態度，讓開發社群怒火中燒。許多網友怒批這根本是科技界的縮水式通膨（Shrinkflation）。在 Hacker News 上，許多開發者表示已經取消了 Anthropic 的高階方案，轉而將主力工作流切換回額度更透明的 Cursor 或是 OpenAI Codex。

給台灣開發者的避雷自救指南

雖然官方在 4 月初釋出的 v2.1.90 與 v2.1.91 版本中已陸續修復了導致快取命中率低下的核心 Bug，但 TTL 被縮短為 5 分鐘已成定局。如果你目前仍重度依賴 Claude Code 工作，CyberQ 建議參考以下幾招自救方案來止血。

當不知道自己的使用額度情形，請先看這一篇 claude-usage 破解 Claude 用量盲盒，近期配額災情與生態觀察，安裝這個外掛程式來掌握自己的額度。

首先是改用 NPM 版本安裝，避免使用官方提供的獨立執行檔（install.sh）。透過 Node.js 環境執行 npx @anthropic-ai/claude-code，可以避開部分底層寫死（hardcoded）的字串替換 Bug。

接著確保更新至最新版，請檢查你的 Claude Code 版本，務必升級至 v2.1.91 或以上版本，確保快取命中率回到 97% 以上的正常水準。

戒掉 –resume，適時清空記憶，這是因為在 5 分鐘 TTL 的限制下，恢復閒置超過一小時的長對話非常不划算。與其讓 AI 重新載入龐大的無效歷史，不如適時使用 /clear 或 /compact 重新建立乾淨的工作對話。

改用 Sonnet 4.6 模型也是一個方式，官方指出 Opus 模型的消耗速率大約是 Sonnet 的兩倍。針對一般的重構與除錯任務，切換到 Sonnet 4.6 能大幅延長配額的存活時間。

限制上下文視窗記得設定，我們可以在終端機設定環境變數 export CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000，強制限制過大的上下文，避免單次請求燒掉過多 Token。

CyberQ 認為，Claude Code 雖然對開發者來說真的很好用，但這次 #45756 事件其實說到底，當我們將生產力高度依賴於不透明計費的雲端 AI 服務時，官方一個伺服器端的小偷改，就能讓開發者的工作流癱瘓。未來這類工具如何在商業擴展成本與使用者體驗信任間取得平衡，我們就等 Anthropic 給大家答案囉。

claude-usage 破解 Claude 用量盲盒，近期配額災情與生態觀察

受不了 Claude 的限制或當掉不能用的時候嗎? 將每月 100 美元預算重新分配給 Zed 與 OpenRouter 的最佳化策略

Anthropic 鐵腕封鎖 OpenClaw 等第三方平台接入！算力吃到飽神話破滅，AI 代理市場面臨大洗牌

Claude 開放無痛移轉 ChatGPT 等 AI 平台用戶記憶資料，將 AI 記憶給自家設備或 NAS 託管的架構思考

AI 代理人正式接管桌面：Anthropic Claude Computer Use 的強大與資安隱憂

Anthropic 發表 Claude Code Review

Claude Code 的 Vercel 擴充套件爆發隱私爭議，偷偷讀取所有專案的提示詞與 Bash 指令？

為什麼看起來寫得不夠嚴謹的 Claude Code 能創造 25 億美元營收？50 萬行外流原始碼的拆解啟示

51 萬行程式碼機密外流！Claude Code 史詩級烏龍與開源神作 claw-code 的重生

Anthropic 怒控 DeepSeek 等三家中國廠商發動蒸餾攻擊竊取 Claude 技術

一則推文蒸發百億美元！Anthropic 推出 Claude Code Security，為何引爆全球資安股大崩盤？

月繳 3,000 台幣卻撐不到兩小時？Claude Code 爆發吃額度災情，官方偷改 TTL + 致命 Bug 惹怒開發者

不僅僅是馬斯克的危機：從 xAI 電廠爭議看 2026 年 AI 產業的能源反撲

看過上千次 OpenClaw 部署：AI 代理爆紅背後的殘酷真相與社群反思

歐洲網路安全局（ENISA）4 月份最新漏洞警告：未經授權 RCE 與零日攻擊企業邊界防護

不僅僅是馬斯克的危機：從 xAI 電廠爭議看 2026 年 AI 產業的能源反撲

BabyQ

相關文章

不僅僅是馬斯克的危機：從 xAI 電廠爭議看 2026 年 AI 產業的能源反撲

看過上千次 OpenClaw 部署：AI 代理爆紅背後的殘酷真相與社群反思

歐洲網路安全局（ENISA）4 月份最新漏洞警告：未經授權 RCE 與零日攻擊企業邊界防護

TIOBE 程式語言排行榜解析：Python 穩居王座、Java 探底，AI 時代下的技術版圖洗牌

WireGuard Windows 用戶端新版革新了底層架構與微軟憑證風波始末

無可取代的科技氣體：解析 2026 氦氣危機與半導體供應鏈的關鍵問題

推薦閱讀