隨著生成式人工智慧從單純的聊天對話,演進到具備自主規劃能力的人工智慧代理(AI Agents),企業原本預期的數位轉型紅利卻迎來一場意想不到的成本海嘯。《財富》(Fortune)雜誌最新報導 (Microsoft reports are exposing AI’s real cost problem: Using the tech is more expensive than paying human employees)指出,微軟內部近期因為 Token (詞元) 成本過高而取消了 Claude Code 的授權,這項舉動戳破了 AI 成本低廉的幻象,更帶出一個殘酷的現實,在許多複雜的自動化場景中,執行 AI 技術的成本甚至已經超過了支付給人類員工的薪資。
微軟與 Uber 的真實警訊:當補貼時代終結
本週在社群平台與科技媒體圈討論的議題之一,是這次微軟內部終止 Claude Code 授權的決策。這款由 Anthropic 開發的開發者工具雖然功能強大,但其基於 Token 消耗的計費模式在自動化程式碼生成與除錯的場景下,會以驚人的速度吞噬預算。即使是微軟這類擁有近乎無限雲端基礎設施與龐大資金的大廠,也難以承受如此高昂的非預期開銷。這項決策直接印證了市場對於 AI 營運成本失控的普遍擔憂。
無獨有偶,叫車大廠 Uber 也被爆出在短短四個月內就將整個 2026 年度的 AI 預算消耗殆盡。這些真實案例共同宣告了 AI 補貼時代的終結。過去由創投基金或大廠自行吸收的模型研發與推論成本,正加速轉嫁到終端企業客戶身上,企業在導入技術時必須更精準地面對每一筆資料與運算資產的消耗,無法再盲目擴張。
OpenAI 更有加入該公司的龍蝦創辦人 Peter Steinberger 提到的,三人團隊因為做全自動化代理的環境,一個月燒掉了 130 萬美元的 Tokens, AI 代理程式總共發了 760 萬次 API 請求,消耗約六千億個 Tokens。
Token 悖論:單位價格下降,總體帳單暴增
市場上正在上演一場被稱為 Token 悖論的奇特現象。一方面,各大模型提供商競爭白熱化,每單位 Token 的基礎價格持續下修,但另一方面,企業最終收到的帳單金額卻反而節節攀升。造成這個現象的核心原因在於自主型代理模型的架構設計。傳統的單次問答只需要處理單一輸入與輸出,成本相對可控。然而,自主型 AI 代理在執行一項複雜任務時,必須在後台進行多步驟的自主規劃、推理、自我糾錯、多代理協調與頻繁的上下文狀態更新。這種重複的上下文載入與大量的後台互動,導致單次任務所消耗的 Token 數量呈現幾何級數增長,完全抵消了單價下降所帶來的優勢。
不但如此,各家公司的工程師們在與 AI 互動的時候,不論是複雜問題、基礎問題都來問 AI ,發送 API 請求,使得 Token 消耗量持續大量上升,CyberQ 預估這個數字將大幅暴增,將是過往的數十倍到上百倍以上。
根據高盛(Goldman Sachs)的最新預估報告 (AI Agents Forecast to Boost Tech Cash Flow as Usage Soars),隨著消費者與企業全面擁抱 AI 代理,到二零三零年全球每月的 Token 消耗量將激增二十四倍,達到令人震驚的一百二十億億(120 quadrillion)個。這種爆炸性的需求成長意味著,如果 Token 消耗速度持續超越單價下跌的幅度,短期與中期內企業面臨的財務壓力將遠超執行長們在財務模型中的樂觀預估。
計費機制轉向:開發者社群的集體焦慮
這個成本焦慮也直接反映在軟體大廠的定價策略調整上。GitHub 已經宣佈自 2026 年 6 月 1 日起變更其 Copilot 的計費模式,將原本基於請求次數的定額配額,全面改為基於 Token 消耗的「GitHub AI Credits」點數制。雖然基礎訂閱月費維持不變,但計費方式將精確計算輸入、輸出以及快取 Token 的消耗。
這項調整迅速引發了開發者社群的普遍反彈,許多工程師抱怨這等同於變相實質漲價,未來在執行相同複雜度的開發工作時,使用者所獲得的實質服務可能會大幅縮水,除非支付更多的超額費用。這進一步證明,即便是開發工具的大廠,也必須轉向按量計費以確保自身的利潤率。
資安工程與合規顧問的新考驗
CyberQ 觀察,對於資訊安全工程師、資安合規顧問以及 AI 工具程式開發者而言,這波成本風暴帶來了全新的考驗。在系統架構設計上,如何最佳化上下文視窗管理、提升快取命中率,並透過更精準的提示詞工程來減少無謂的 Token 浪費,已成為衡量 AI 開發者能力的關鍵指標。傳統上,資訊與架構工程師、AI 架構師、資安工程師主要關注防範注入攻擊或資料洩漏,如今則必須將成本防禦納入架構考量。
CyberQ 認為,從合規與風險管理角度來看,傳統的 IT 預算模型完全無法適應這種基於消耗量且具備高度不確定性的計費方式。資安與合規團隊必須建立起全新的即時監控機制,防範因為惡意攻擊、無窮迴圈或授權濫用而導致的財務阻斷服務(Economic Denial of Sustainability, EDoS)風險。企業需要建立明確的代理執行權限閾值與熔斷機制,確保自動化系統不會在無人看管的情況下燒毀百萬預算。
AI 代理所描繪的「宏觀授權、微觀引導」的神奇願景確實令人心生嚮往,但理想很美好,現實很骨感,在技術邁向完全成熟之前,成本管理就很麻煩了。微軟既然開始 Token 費用的,連他們這麼多錢的公司都要省 AI 費用,那其他的科技公司會怎樣做呢?
微軟官方對 AI 代理架構與多代理系統佈署指引: https://techcommunity.microsoft.com/blog/azure-ai-foundry-blog/three-tiers-of-agentic-ai—and-when-to-use-none-of-them/4510377







