CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • 首頁
    • 關於我們
    • 隱私權政策
  • 新聞
  • AI 人工智慧
    • AI 應用實戰
    • AI 代理
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊
聯繫我們
  • 首頁
    • 關於我們
    • 隱私權政策
  • 新聞
  • AI 人工智慧
    • AI 應用實戰
    • AI 代理
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊
沒有結果
觀看所有搜尋結果
CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • 首頁
  • 新聞
  • AI 人工智慧
  • 資安
  • Docker
  • 進階應用
  • 網通
  • NAS
  • 開箱測試
  • 教學
  • 展覽直擊
首頁 新聞 AI 人工智慧

Fable 5 Token 節省新技巧爆紅:把 Prompt 變成圖片,最高可降低近七成成本?

Chen Glenn by Chen Glenn
2026 年 07 月 04 日 15:00
in AI 人工智慧, 新聞
閱讀時間: 3 分鐘
A A
Fable 5 Token 節省新技巧爆紅:把 Prompt 變成圖片,最高可降低近七成成本?
471
觀看數
分享到臉書分享到 X分享到Line分享到 Threads分享到 Linkedin

近期日本科技媒體人在 X(前 Twitter)分享了一項有趣的實驗,引發 AI 開發社群熱烈討論。

RELATED POSTS

Ollama 0.31 導入多 Token 預測技術,邊緣端執行 Gemma 4 效能提升近九成

AI 術語百科全書|瀏覽器替代方案彙整|企業 AI 避險策略|產業精選 07.04

閉源與開源模型的差距被高估?從 Reddit 熱議看 AI 外掛開發的隱形實力

Fable 5のトークン節約するとんでもない裏技出てきたwww

Claudeは画像のトークンコストを、画像内のテキスト量ではなく ピクセルサイズによって固定する
↓
賢い人「じゃあ画像に指示貼って送ってOCRさせればよくね?」
↓
約59~70%のトークン節約に成功!!
👇️詳しくは pic.twitter.com/Bu00BdAqRP

— 篠原 修司 (@digimaga) July 4, 2026

有人發現,Anthropic 最新 Fable 5 模型處理圖片時,圖片 Token 的計算方式並非依照圖片中包含多少文字,而是主要依據圖片解析度(Pixel Size)來計算。

因此有人想到一個相當「工程師式」的做法:

與其把數千字 Prompt 直接送給模型,不如把這些文字先渲染成一張圖片,再交由模型 OCR 辨識。

初步測試結果顯示,Token 使用量竟然可降低約 59%~70%。

這個技巧迅速在 GitHub 與 X 社群流傳,也讓不少人重新思考大型語言模型的成本最佳化策略。

為什麼會出現這種現象?

大多數人都以為,圖片裡文字越多,Token 就越多。但目前 Fable 5 並不是這樣計算。模型會先經過 Vision Encoder,把圖片轉換成內部特徵(Embedding),因此成本主要來自圖片解析度、圖片尺寸、視覺 Patch 數量,而非圖片裡到底有多少文字。

所以呢,一張 1024×1024 的圖片,即使只有一句話,和塞滿數千字,Vision Input Token 幾乎沒有太大差異。因此,只要圖片尺寸固定,就能把大量 Prompt 壓縮進同一張圖片,這超讚的。

社群實驗 Token 最高下降近七成

社群開發者將大量 Prompt:

原本:

純文字 Prompt
↓

LLM Tokenizer
↓

數萬 Token

改成:

文字
↓

Render 成 PNG
↓

Vision Input
↓

OCR
↓

LLM 理解

結果發現,Token 使用下降約 59~70%,回答品質幾乎沒有明顯下降,OCR 辨識率仍維持相當高水準,對需要長 Prompt 的 Agent Workflow 特別有吸引力。

GitHub 已經出現工具

隨著討論發酵,GitHub 很快就有人推出工具來搭配使用,如 :

pxpipe

它會自動將文字 Prompt Render 成圖片,再傳送給 Fable 5,利用模型 OCR 讀取,來大幅降低 Input Token,基本上就是把整個流程自動化。

這類工具最大的目的是降低 Agent Workflow、長 Context、RAG 與多文件分析所帶來的 Token 成本。

為什麼這招對 Agent 特別有吸引力?

近年來最大的 AI 成本,主要聚焦在Agent Memory、MCP Context、Tool Calling、大量 Prompt 與長文件。

例如一個企業 Agent:

System Prompt
15,000 Token

Memory
12,000 Token

Tool Context
18,000 Token

文件
25,000 Token

真正推高成本的,通常都是 Input。因此如果能把其中大量文字變成圖片,成本便可能瞬間下降。尤其當 Agent 一天要呼叫數千次模型時,節省效果會十分可觀。

代價是 OCR 可能辨識錯誤,推理速度變慢

目前這個技巧仍有不少限制,首先是 OCR 並非百分之百正確,萬一辨識錯了怎麼辦呢 ? 如果圖片字太小,壓縮率過高,或者是字體特殊、排版複雜,那進行 OCR 字元辨識時可能出錯。

尤其 JSON、YAML、程式碼等等,是有可能辨識失敗。

再來呢,推理速度可能變慢,Vision Model 必須:

圖片

↓

Vision Encoder

↓

OCR

↓

LLM

相比直接文字輸入,多了一個視覺辨識流程,速度未必比較快。

並非所有模型都適用

目前這個技巧主要針對 Claude Fable 5,主要是 Vision 能力非常強。但其他不同模型的圖片 Token 計算方式不同。例如 GPT、Gemini、Grok 等等未必會有同樣效果,甚至可能沒有省太多。

未來的 Prompt Engineering

這件事情真正值得注意的,除了省 Token,更重要的是大型語言模型的成本最佳化,需要在 Prompt Engineering 的基礎上,繼續最佳化 Input Engineering。我們得把Context 壓縮、Memory Encoding、Image Context、多模態輸入、Token Routing做一遍,甚至不同資訊需要轉換成純文字、圖片、表格、向量,陸續去選擇成本最低的輸入方式。

CyberQ 觀察

這次社群提出的方法,本質上是一種利用 Vision 編碼特性的成本最佳化技巧,而不是模型漏洞。它反映的是目前多模態模型在 Token 計價上的設計差異,而非官方建議的使用方式。

是否能長期維持這種節省效果,仍取決於模型供應商未來是否調整計價機制或 Vision Encoder 的實作。隨著各家 AI 業者持續優化成本模型,這類Render 成圖片再 OCR 的方法,未來可能被重新計價,甚至失去優勢。

然而,這項實驗仍提供了一個有意思的方向,大家得想辦法設計更有效率的上下文(Context)與輸入(Input)策略來省錢。 對每天需要處理大量 Prompt、長文件或工具鏈的企業而言,這種思維可以思考一下長期去調整輸入的價值。

Spoons上市首日飆漲40%|Anthropic 恢復全球最強 AI Claude Fable 5 使用|產業精選 07.02
Ollama 0.31 導入多 Token 預測技術,邊緣端執行 Gemma 4 效能提升近九成
Anthropic 低價 Sonnet 5 衝刺 IPO,美政府亦解除對Fable 5 和 Mythos 5 的出口管制|產業精選 07.01
美政府發布緊急出口管制令,Anthropic 遭強令全球下架 Fable 5 與 Mythos 5 模型
標籤: Fable 5OCRpxpipe
Share6Tweet4ShareShareShare1
上一篇

Ollama 0.31 導入多 Token 預測技術,邊緣端執行 Gemma 4 效能提升近九成

Chen Glenn

Chen Glenn

開發工程師,目前在北台灣的科技業任職。

相關文章

Ollama 0.31 導入多 Token 預測技術,邊緣端執行 Gemma 4 效能提升近九成
AI 應用實戰

Ollama 0.31 導入多 Token 預測技術,邊緣端執行 Gemma 4 效能提升近九成

2026 年 7 月 4 日
AI 術語百科全書|瀏覽器替代方案彙整|企業 AI 避險策略|產業精選 07.04
新聞

AI 術語百科全書|瀏覽器替代方案彙整|企業 AI 避險策略|產業精選 07.04

2026 年 7 月 4 日
閉源與開源模型的差距被高估?從 Reddit 熱議看 AI 外掛開發的隱形實力
AI 人工智慧

閉源與開源模型的差距被高估?從 Reddit 熱議看 AI 外掛開發的隱形實力

2026 年 7 月 3 日
【下篇】2026 年全球 NAS 市場成長背後的結構轉變:AI、儲存需求與基礎設施升級
NAS

【下篇】2026 年全球 NAS 市場成長背後的結構轉變:AI、儲存需求與基礎設施升級

2026 年 7 月 3 日
新聞

AI進展不如預期、太空軍事競賽升溫|產業精選 07.03

2026 年 7 月 3 日
AI 裁員決策大轉彎 ? 部分公司重新招募人類員工
AI 人工智慧

AI 裁員決策大轉彎 ? 部分公司重新招募人類員工

2026 年 7 月 2 日

推薦閱讀

Fable 5 Token 節省新技巧爆紅:把 Prompt 變成圖片,最高可降低近七成成本?

Fable 5 Token 節省新技巧爆紅:把 Prompt 變成圖片,最高可降低近七成成本?

2026 年 7 月 4 日
Ollama 0.31 導入多 Token 預測技術,邊緣端執行 Gemma 4 效能提升近九成

Ollama 0.31 導入多 Token 預測技術,邊緣端執行 Gemma 4 效能提升近九成

2026 年 7 月 4 日
AI 術語百科全書|瀏覽器替代方案彙整|企業 AI 避險策略|產業精選 07.04

AI 術語百科全書|瀏覽器替代方案彙整|企業 AI 避險策略|產業精選 07.04

2026 年 7 月 4 日
閉源與開源模型的差距被高估?從 Reddit 熱議看 AI 外掛開發的隱形實力

閉源與開源模型的差距被高估?從 Reddit 熱議看 AI 外掛開發的隱形實力

2026 年 7 月 3 日
【下篇】2026 年全球 NAS 市場成長背後的結構轉變:AI、儲存需求與基礎設施升級

【下篇】2026 年全球 NAS 市場成長背後的結構轉變:AI、儲存需求與基礎設施升級

2026 年 7 月 3 日

近期熱門

  • 母公司喊安、子公司爆外洩?PChome 與比比昂面臨暗網威脅與個資外流的雙重考驗

    母公司喊安、子公司爆外洩?PChome 與比比昂面臨暗網威脅與個資外流的雙重考驗

    190 shares
    Share 76 Tweet 48
  • 部署 Hermes Agent 實戰,24 小時不間斷的地端自動化 AI 助理

    165 shares
    Share 66 Tweet 41
  • 美國政府同意重新開放 Anthropic 新模型部署於關鍵基礎設施,三大 AI 大廠次世代模型管制與延期內幕

    231 shares
    Share 92 Tweet 58
  • 100GbE NFS over RDMA 實戰,直連 DGX Spark 執行 DS4 大型模型突破 AI 推理儲存瓶頸

    157 shares
    Share 63 Tweet 39
  • Google AI 人才大撤退:OpenAI 與 Anthropic 正在重塑下一代模型版圖

    151 shares
    Share 60 Tweet 38
  • GitHub 趨勢周報 Vol.21:本機優先專案與 AI 代理安全防線的演進

    145 shares
    Share 58 Tweet 36
  • AI 裁員決策大轉彎 ? 部分公司重新招募人類員工

    128 shares
    Share 51 Tweet 32
  • 【中篇】開放架構的真正價值:從資料儲存走向 AI 與智慧家庭中樞

    126 shares
    Share 50 Tweet 32
  • Anthropic 低價 Sonnet 5 衝刺 IPO,美政府亦解除對Fable 5 和 Mythos 5 的出口管制|產業精選 07.01

    121 shares
    Share 48 Tweet 30
  • 別再開 Port 裸奔!用 Tailscale + QNAP 打造免網管的跨國 10GbE 影音協作圈

    120 shares
    Share 48 Tweet 30

關於 CyberQ 賽博客

CyberQ 賽博客網站的命名正是 Cyber + Q ,是賽博網路、資訊、共識 / 高可用叢集、量子科技與品質的綜合體。

我們專注於企業級網路與儲存環境建構、NAS 系統整合、資安解決方案與 AI 應用顧問服務。透過以下三大面向的「Q」核心元素,我們為您提供從基礎架構到資料智慧的雙引擎驅動力:

Quorum 與 Quantum-safe

在技術架構上,是基於信任的基礎架構,CyberQ 深入掌握分散式系統中的 Quorum(一致性)、Queue(任務調度) 與 QoS(服務品質),以 Quick(效率) 解決複雜的 IT 與資安問題。同時,我們積極投入 Quantum-safe(後量子密碼學) 等新興資安領域,確保企業基礎設施在未來運算時代具備堅不可摧的長期競爭力。

Query 與 Quotient

CyberQ 是協助企業成長的 AI 引擎,在堅韌的架構之上,我們透過 Query(洞察) 解析大量資料,並以 Quotient(提升企業科技智商) 的顧問服務,將 AI 導入本機端環境與自動化工作流程中,將資料轉化為企業最具價值的數位資產。

Quest與 Quantum Leap

專業媒體與技術顧問是我們的核心雙動能。

作為科技媒體,我們秉持駭客精神持續進行科技 Quest(探索),探索海內外產業動態。

作為顧問團隊,我們結合多年第一線實務經驗,提供量身打造的最佳化解決方案,協助企業完成數位轉型的 Quantum Leap(躍進)。

新聞稿、採訪、授權、內容投訴、行銷合作、投稿刊登:[email protected]
廣告委刊、展覽會議、系統整合、資安顧問、業務提攜:[email protected]

Copyright ©2026 CyberQ.tw All Rights Reserved.

沒有結果
觀看所有搜尋結果
  • 首頁
    • 關於我們
    • 隱私權政策
  • 新聞
  • AI 人工智慧
    • AI 應用實戰
    • AI 代理
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊

© 2025 CyberQ NAS、資安、資訊科技、AI應用的日常 關於 CyberQ 賽博客 NAS 系統與電腦、手機一起的生活故事 多年的系統整合與資訊安全經驗,協助智慧家居、小型工作室、辦公室與機構,導入更便利、更安全的資訊環境與應用。