CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • 首頁
    • 關於我們
    • 隱私權政策
  • 新聞
  • AI 人工智慧
    • AI 應用實戰
    • AI 代理
    • 龍蝦
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊
聯繫我們
  • 首頁
    • 關於我們
    • 隱私權政策
  • 新聞
  • AI 人工智慧
    • AI 應用實戰
    • AI 代理
    • 龍蝦
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊
沒有結果
觀看所有搜尋結果
CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • 首頁
  • 新聞
  • AI 人工智慧
  • 資安
  • Docker
  • 進階應用
  • 網通
  • NAS
  • 開箱測試
  • 教學
  • 展覽直擊
首頁 新聞 AI 人工智慧

萬物皆 Token 的代價:從微軟停用 Claude Code 與 Uber 預算超支,看 AI 代理時代的成本悖論

Ashley Hsieh by Ashley Hsieh
2026 年 05 月 24 日 09:00
in AI 人工智慧, 新聞
閱讀時間: 3 分鐘
A A
萬物皆 Token 的代價:從微軟停用 Claude Code 與 Uber 預算超支,看 AI 代理時代的成本悖論
2.7k
觀看數
分享到臉書分享到 X分享到Line分享到 Threads分享到 Linkedin

隨著生成式人工智慧從單純的聊天對話,演進到具備自主規劃能力的人工智慧代理(AI Agents),企業原本預期的數位轉型紅利卻迎來一場意想不到的成本海嘯。《財富》(Fortune)雜誌最新報導 (Microsoft reports are exposing AI’s real cost problem: Using the tech is more expensive than paying human employees)指出,微軟內部近期因為 Token (詞元) 成本過高而取消了 Claude Code 的授權,這項舉動戳破了 AI 成本低廉的幻象,更帶出一個殘酷的現實,在許多複雜的自動化場景中,執行 AI 技術的成本甚至已經超過了支付給人類員工的薪資。

RELATED POSTS

當 AI 遇上羅馬萬神殿:從 OpenSCAD 評測看大型語言模型的空間幾何建構力

看板管理遇上自主 Agent:KanBots

當資安守門人漏了鑰匙:CISA 承包商外洩 AWS GovCloud 憑證引發國會與市場關切

微軟與 Uber 的真實警訊:當補貼時代終結

本週在社群平台與科技媒體圈討論的議題之一,是這次微軟內部終止 Claude Code 授權的決策。這款由 Anthropic 開發的開發者工具雖然功能強大,但其基於 Token 消耗的計費模式在自動化程式碼生成與除錯的場景下,會以驚人的速度吞噬預算。即使是微軟這類擁有近乎無限雲端基礎設施與龐大資金的大廠,也難以承受如此高昂的非預期開銷。這項決策直接印證了市場對於 AI 營運成本失控的普遍擔憂。

無獨有偶,叫車大廠 Uber 也被爆出在短短四個月內就將整個 2026 年度的 AI 預算消耗殆盡。這些真實案例共同宣告了 AI 補貼時代的終結。過去由創投基金或大廠自行吸收的模型研發與推論成本,正加速轉嫁到終端企業客戶身上,企業在導入技術時必須更精準地面對每一筆資料與運算資產的消耗,無法再盲目擴張。

OpenAI 更有加入該公司的龍蝦創辦人 Peter Steinberger 提到的,三人團隊因為做全自動化代理的環境,一個月燒掉了 130 萬美元的 Tokens, AI 代理程式總共發了 760 萬次 API 請求,消耗約六千億個 Tokens。

Token 悖論:單位價格下降,總體帳單暴增

市場上正在上演一場被稱為 Token 悖論的奇特現象。一方面,各大模型提供商競爭白熱化,每單位 Token 的基礎價格持續下修,但另一方面,企業最終收到的帳單金額卻反而節節攀升。造成這個現象的核心原因在於自主型代理模型的架構設計。傳統的單次問答只需要處理單一輸入與輸出,成本相對可控。然而,自主型 AI 代理在執行一項複雜任務時,必須在後台進行多步驟的自主規劃、推理、自我糾錯、多代理協調與頻繁的上下文狀態更新。這種重複的上下文載入與大量的後台互動,導致單次任務所消耗的 Token 數量呈現幾何級數增長,完全抵消了單價下降所帶來的優勢。

不但如此,各家公司的工程師們在與 AI 互動的時候,不論是複雜問題、基礎問題都來問 AI ,發送 API 請求,使得 Token 消耗量持續大量上升,CyberQ 預估這個數字將大幅暴增,將是過往的數十倍到上百倍以上。

根據高盛(Goldman Sachs)的最新預估報告 (AI Agents Forecast to Boost Tech Cash Flow as Usage Soars),隨著消費者與企業全面擁抱 AI 代理,到二零三零年全球每月的 Token 消耗量將激增二十四倍,達到令人震驚的一百二十億億(120 quadrillion)個。這種爆炸性的需求成長意味著,如果 Token 消耗速度持續超越單價下跌的幅度,短期與中期內企業面臨的財務壓力將遠超執行長們在財務模型中的樂觀預估。

計費機制轉向:開發者社群的集體焦慮

這個成本焦慮也直接反映在軟體大廠的定價策略調整上。GitHub 已經宣佈自 2026 年 6 月 1 日起變更其 Copilot 的計費模式,將原本基於請求次數的定額配額,全面改為基於 Token 消耗的「GitHub AI Credits」點數制。雖然基礎訂閱月費維持不變,但計費方式將精確計算輸入、輸出以及快取 Token 的消耗。

這項調整迅速引發了開發者社群的普遍反彈,許多工程師抱怨這等同於變相實質漲價,未來在執行相同複雜度的開發工作時,使用者所獲得的實質服務可能會大幅縮水,除非支付更多的超額費用。這進一步證明,即便是開發工具的大廠,也必須轉向按量計費以確保自身的利潤率。

資安工程與合規顧問的新考驗

CyberQ 觀察,對於資訊安全工程師、資安合規顧問以及 AI 工具程式開發者而言,這波成本風暴帶來了全新的考驗。在系統架構設計上,如何最佳化上下文視窗管理、提升快取命中率,並透過更精準的提示詞工程來減少無謂的 Token 浪費,已成為衡量 AI 開發者能力的關鍵指標。傳統上,資訊與架構工程師、AI 架構師、資安工程師主要關注防範注入攻擊或資料洩漏,如今則必須將成本防禦納入架構考量。

CyberQ 認為,從合規與風險管理角度來看,傳統的 IT 預算模型完全無法適應這種基於消耗量且具備高度不確定性的計費方式。資安與合規團隊必須建立起全新的即時監控機制,防範因為惡意攻擊、無窮迴圈或授權濫用而導致的財務阻斷服務(Economic Denial of Sustainability, EDoS)風險。企業需要建立明確的代理執行權限閾值與熔斷機制,確保自動化系統不會在無人看管的情況下燒毀百萬預算。

AI 代理所描繪的「宏觀授權、微觀引導」的神奇願景確實令人心生嚮往,但理想很美好,現實很骨感,在技術邁向完全成熟之前,成本管理就很麻煩了。微軟既然開始 Token 費用的,連他們這麼多錢的公司都要省 AI 費用,那其他的科技公司會怎樣做呢?

微軟官方對 AI 代理架構與多代理系統佈署指引: https://techcommunity.microsoft.com/blog/azure-ai-foundry-blog/three-tiers-of-agentic-ai—and-when-to-use-none-of-them/4510377

當 AI 遇上羅馬萬神殿:從 OpenSCAD 評測看大型語言模型的空間幾何建構力
當 AI 遇上羅馬萬神殿:從 OpenSCAD 評測看大型語言模型的空間幾何建構力
Google Antigravity 2.0 大改版:是 AI 代理革命,還是強迫升級的災難?開發者怒火、雙工具拆分全解析
ComfyUI v0.22.0:原生支援 Stable Audio 3、MoGe 單目幾何估計,並大幅強化 LTX 工作流
AI 已經突破科技圈邊界
Google 前執行長演講遭噓,年輕世代對 AI 反感加劇
Nature 最新研究指出國家媒體控制如何影響大型語言模型
Caveman 幫 AI 開發者暴力省下 75% Token 成本
標籤: AI AgentsAnthropicClaudeClaude CodemicrosoftTokenToken 悖論Uber微軟
Share32Tweet20ShareShareShare6
上一篇

當 AI 遇上羅馬萬神殿:從 OpenSCAD 評測看大型語言模型的空間幾何建構力

Ashley Hsieh

Ashley Hsieh

專案管理者與 UI/UX 設計、AI美術設計認證、淨零碳規劃管理師,在上市歐洲外商、生醫、金融、科技產業中淬煉,曾參與過多個跨平台專案,從需求分析、設計、使用者測試到專案交付流程都樂在其中。 私底下,我是一位「喜歡買東西但錢包容易抗議」的人,對科技、設計與藝術有熱情,正在努力平衡質感生活,學習和錢包一起成長的日常小練習者。

相關文章

當 AI 遇上羅馬萬神殿:從 OpenSCAD 評測看大型語言模型的空間幾何建構力
AI 人工智慧

當 AI 遇上羅馬萬神殿:從 OpenSCAD 評測看大型語言模型的空間幾何建構力

2026 年 5 月 23 日
看板管理遇上自主 Agent:KanBots
AI 人工智慧

看板管理遇上自主 Agent:KanBots

2026 年 5 月 23 日
當資安守門人漏了鑰匙:CISA 承包商外洩 AWS GovCloud 憑證引發國會與市場關切
新聞

當資安守門人漏了鑰匙:CISA 承包商外洩 AWS GovCloud 憑證引發國會與市場關切

2026 年 5 月 23 日
Pwn2Own Berlin 2026 落幕 台灣團隊奪冠 Orange Tsai 人工智慧實測解析
AI 人工智慧

Pwn2Own Berlin 2026 落幕 台灣團隊奪冠 Orange Tsai 人工智慧實測解析

2026 年 5 月 22 日
Gemini 3.5 Flash 實測逆襲 3.1 Pro? AI 模型選型看五大工作負載核心再來抉擇
AI 人工智慧

Gemini 3.5 Flash 實測逆襲 3.1 Pro? AI 模型選型看五大工作負載核心再來抉擇

2026 年 5 月 22 日
Proxmox VE 9.2 正式釋出:邁入 Linux Kernel 7.0 與 CRS 動態負載平衡新時代
企業解決方案

Proxmox VE 9.2 正式釋出:邁入 Linux Kernel 7.0 與 CRS 動態負載平衡新時代

2026 年 5 月 22 日

推薦閱讀

萬物皆 Token 的代價:從微軟停用 Claude Code 與 Uber 預算超支,看 AI 代理時代的成本悖論

萬物皆 Token 的代價:從微軟停用 Claude Code 與 Uber 預算超支,看 AI 代理時代的成本悖論

2026 年 5 月 24 日
當 AI 遇上羅馬萬神殿:從 OpenSCAD 評測看大型語言模型的空間幾何建構力

當 AI 遇上羅馬萬神殿:從 OpenSCAD 評測看大型語言模型的空間幾何建構力

2026 年 5 月 23 日
看板管理遇上自主 Agent:KanBots

看板管理遇上自主 Agent:KanBots

2026 年 5 月 23 日
當資安守門人漏了鑰匙:CISA 承包商外洩 AWS GovCloud 憑證引發國會與市場關切

當資安守門人漏了鑰匙:CISA 承包商外洩 AWS GovCloud 憑證引發國會與市場關切

2026 年 5 月 23 日
Pwn2Own Berlin 2026 落幕 台灣團隊奪冠 Orange Tsai 人工智慧實測解析

Pwn2Own Berlin 2026 落幕 台灣團隊奪冠 Orange Tsai 人工智慧實測解析

2026 年 5 月 22 日

近期熱門

  • GitHub 趨勢周報 Vol.15:AI Agent 技能市集化爆發,個人 AI、研究助理與地端語音模型成為本週開源主軸

    GitHub 趨勢周報 Vol.15:AI Agent 技能市集化爆發,個人 AI、研究助理與地端語音模型成為本週開源主軸

    199 shares
    Share 80 Tweet 50
  • Google Antigravity 2.0 大改版:是 AI 代理革命,還是強迫升級的災難?開發者怒火、雙工具拆分全解析

    198 shares
    Share 79 Tweet 50
  • Proxmox VE 9.2 正式釋出:邁入 Linux Kernel 7.0 與 CRS 動態負載平衡新時代

    183 shares
    Share 73 Tweet 46
  • Fragnesia 再揭 Linux 核心提權風險:Dirty Frag 同類攻擊面,低權限使用者可能取得 root

    153 shares
    Share 61 Tweet 38
  • 買 NAS 不只是備份,QNAP Virtualization Station 如何把 NAS 變成輕量級虛擬化平台

    150 shares
    Share 60 Tweet 38
  • WordPress 7.0 正式發布:AI Client API 入主核心、後台全面現代化

    146 shares
    Share 58 Tweet 37
  • 當 AI 遇上羅馬萬神殿:從 OpenSCAD 評測看大型語言模型的空間幾何建構力

    144 shares
    Share 58 Tweet 36
  • Gemini 3.5 Flash 實測逆襲 3.1 Pro? AI 模型選型看五大工作負載核心再來抉擇

    133 shares
    Share 53 Tweet 33
  • Google I/O 2026 重點:Google 把 Gemini 推向代理式 AI 時代,搜尋、工作、開發與商務全面改寫

    129 shares
    Share 52 Tweet 32
  • Linux 7.0 解決 Google 價值百萬美元的 io_uring 安全難題,Rust 也正式成為核心支援語言

    115 shares
    Share 46 Tweet 29

關於 CyberQ 賽博客

CyberQ 賽博客網站的命名正是 Cyber + Q ,是賽博網路、資訊、共識 / 高可用叢集、量子科技與品質的綜合體。

我們專注於企業級網路與儲存環境建構、NAS 系統整合、資安解決方案與 AI 應用顧問服務。透過以下三大面向的「Q」核心元素,我們為您提供從基礎架構到資料智慧的雙引擎驅動力:

Quorum 與 Quantum-safe

在技術架構上,是基於信任的基礎架構,CyberQ 深入掌握分散式系統中的 Quorum(一致性)、Queue(任務調度) 與 QoS(服務品質),以 Quick(效率) 解決複雜的 IT 與資安問題。同時,我們積極投入 Quantum-safe(後量子密碼學) 等新興資安領域,確保企業基礎設施在未來運算時代具備堅不可摧的長期競爭力。

Query 與 Quotient

CyberQ 是協助企業成長的 AI 引擎,在堅韌的架構之上,我們透過 Query(洞察) 解析大量資料,並以 Quotient(提升企業科技智商) 的顧問服務,將 AI 導入本機端環境與自動化工作流程中,將資料轉化為企業最具價值的數位資產。

Quest與 Quantum Leap

專業媒體與技術顧問是我們的核心雙動能。

作為科技媒體,我們秉持駭客精神持續進行科技 Quest(探索),探索海內外產業動態。

作為顧問團隊,我們結合多年第一線實務經驗,提供量身打造的最佳化解決方案,協助企業完成數位轉型的 Quantum Leap(躍進)。

新聞稿、採訪、授權、內容投訴、行銷合作、投稿刊登:[email protected]
廣告委刊、展覽會議、系統整合、資安顧問、業務提攜:[email protected]

Copyright ©2026 CyberQ.tw All Rights Reserved.

沒有結果
觀看所有搜尋結果
  • 首頁
    • 關於我們
    • 隱私權政策
  • 新聞
  • AI 人工智慧
    • AI 應用實戰
    • AI 代理
    • 龍蝦
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊

© 2025 CyberQ NAS、資安、資訊科技、AI應用的日常 關於 CyberQ 賽博客 NAS 系統與電腦、手機一起的生活故事 多年的系統整合與資訊安全經驗,協助智慧家居、小型工作室、辦公室與機構,導入更便利、更安全的資訊環境與應用。