CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • AI 代理
  • 龍蝦
  • AI 應用實戰
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊
聯繫我們
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • AI 代理
  • 龍蝦
  • AI 應用實戰
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊
沒有結果
觀看所有搜尋結果
CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
  • 新聞
  • AI 代理
  • 龍蝦
  • AI 應用實戰
  • 資安
  • Docker
  • 進階應用
  • 網通
  • NAS
  • 開箱測試
  • 教學
  • 展覽直擊
首頁 新聞 AI 人工智慧

ComfyUI v0.12.0 正式發布,LLM 推論加速與記憶體最佳化

BabyQ by BabyQ
2026 年 02 月 03 日 19:05
閱讀時間: 3 分鐘
A A
ComfyUI v0.12.0 正式發布,LLM 推論加速與記憶體最佳化
2.9k
觀看數
分享到臉書分享到 X分享到Line分享到 Threads分享到 Linkedin

開源 AI 圖像生成的領導工具 ComfyUI 於本週正式釋出 v0.12.0 版本更新。本次更新在底層效能與生成式 AI 的跨領域整合繼續深化。對於長期關注本地端 AI 部署的開發者與創作者而言,這次更新最引人注目的莫過於對大型語言模型(LLM)推論速度的最佳化,以及針對 Windows 使用者長期詬病的記憶體溢出問題修復。

RELATED POSTS

NVIDIA DGX Spark 從單機推進至四節點,AI 電腦叢集讓 Agent 基礎設施成形

ComfyUI v0.18.0 繼續最佳化 VRAM 並全面升級多精度支援

25 億美元 AI 算力走私案:美超微高層落網背後的 NVIDIA GPU 黑市與魔改產業鏈

以下是 CyberQ 實測與彙整的 v0.12.0 版本更新重點分析:

導入 KV Cache 大幅提升 LLM 文字生成效率

在 v0.12.0 中,ComfyUI 開發團隊為 Llama 系列模型導入了 KV Cache(Key-Value Cache) 機制,是加速 LLM 推論的重要技術之一。

在過去的純文字生成節點中,模型在生成每一個新 Token 時,往往需要重新計算先前所有 Token 的注意力權重,這導致生成長文本時速度會呈指數級下降。KV Cache 的加入,讓系統能夠暫存先前計算過的 Key 與 Value 矩陣,這意味著在生成下一個字時,只需計算最新的部分即可。

當我們在 ComfyUI 工作流中整合了本地 LLM(例如用於擴寫 Prompt 或生成影片故事腳本),v0.12.0 的文字生成速度將會有顯著的提升,且我們實測它中,隨著生成文字長度的增加,效能差異會更明顯。

記憶體管理與 VRAM 最佳化

本次更新也針對硬體資源管理進行了多項底層修復,特別是解決了困擾許多 Windows 用戶的「共享記憶體溢出(Shared Memory Spilling)」問題。

過去在 VRAM 吃緊時,系統嘗試調用 Windows 共享記憶體可能導致效能驟降或崩潰,新版本有重新再最佳化這個機制,減少效能降低和崩潰的機率。

另外這次改版也降低了 RAM 佔用,同樣也修復了視訊記憶體 VRAM OOM 的問題,開發者 @rattus128 提交的修復大幅減少了模型加載時的 RAM 需求,並解決了特定情況下的 VRAM 記憶體不足(OOM)錯誤,這對於使用 8GB 或 12GB 顯示卡的用戶來說是一大福音。

新增節點與模型支援

除了底層最佳化,功能層面也有不少新增強化:

這次更新也導入了一些新的 AI 音樂生成模型的範本,很值得去嘗試看看。

新的 Qwen-Image 2512 Turbo 出圖速度極快,也是從 0.11.1 到 0.12.0 後的新增重點範本。

包括 Vidu 影片生成模型更新,新增對 Vidu Q3 模型的支援,並導入了 Extend(延伸)與 MultiFrame 多幀節點,提升了影片生成的連貫性與控制力。

Recraft 風格節點,新增 RecraftCreateStyleNode,這是更便捷的風格遷移和風格鎖定功能,對於追求風格一致性的創作者相當實用。

這次也整合了 HitPaw API 節點,官方持續注重與擴展第三方 API 生態,繼續提供更多樣化的圖像處理服務。

告別 OOM 的秘密武器是動態模型載入 (Adaptive Model Loading)

根據開發者 rattus128 在 PR #11845 的技術說明,v0.12.0 的記憶體最佳化並非僅是參數調整,而是引入了一套全新的 ModelPatcher 實作,其核心基於 comfy-aimdo 函式庫。這項更新帶來了兩個革命性的改變:

首先是智慧型 VRAM 談判機制 (Lazy Loading & Dynamic Negotiation) 的導入,新系統不再像過去那樣「預先估算」VRAM 用量,而是改採「延遲載入(Lazy Load)」策略。只有在模型真正開始推論(例如 KSampler 的第一步)時,系統才會根據當前顯卡狀態,動態決定要載入多少權重。最關鍵的是,如果推論過程中 VRAM 不足,新機制會趕在 OOM記憶體溢位崩潰發生前,自動將部分權重卸載(Offload)到系統記憶體,這讓許多原本會讓 VRAM 爆掉的大模型現在都能順利運行。

其次是 mmap 與 Commit Charge 的最佳化,針對 Windows 系統,開發者特別解決了 Commit Charge 耗盡的問題。在舊版中,模型權重會被完整載入到 RAM 中,這會擠壓作業系統的磁碟快取(Disk Cache)。 新版本利用 PyTorch 的 mmap(記憶體映射)特性,讓模型權重直接停留在磁碟映射區,不佔用實際的程式 RAM。這不僅大幅降低了 Windows 的記憶體壓力,更因為保留了磁碟快取,使得模型的「第二次讀取」速度幾乎是瞬間完成,解決了 Windows 共享記憶體洩漏導致的效能低落問題。

迭代更新快速有好有壞

ComfyUI 的更新頻率極高(距離 v0.11.1 僅數天),這雖然展現了開源社群的強大活力,但也伴隨著部分用戶的更新焦慮。社群中已有部分用戶反映,v0.12.0 的底層改動導致部分舊版自定義節點(Custom Nodes)失效。

CyberQ 建議,若是已經在進行穩定的生產專案,這部分可先建議暫緩更新,使用另一個獨立的環境進行測試後,確定你的工作流和自訂義節點沒問題後,正式生產環境就可以更新導入了。對於熱衷嘗試新技術的玩家來說,這次針對 LLM 與 VRAM 的最佳化絕對值得一試,我們實測了產圖和產影片的記憶體耗用程度比之前少了 5% 到 15% 左右。

ComfyUI v0.11.0 發布:全面支援 Zimage Omni 等多種新模型,VRAM 最佳化再突破
4 秒出圖!FLUX.2 klein 正式登場,實測 BFL 新一代開源生圖模型,支援 NVFP4 與 4B 商用版
ComfyUI v0.10.0 釋出,架構更新、工作模板與 UX 改善
新版ComfyUI v0.4.0 大幅降低 VRAM 用量
ComfyUI v0.3.76 新版搭配 NVIDIA DGX Spark 實戰 Z-Image Turbo 的效能揭密
標籤: ComfyUI
Share35Tweet22ShareShareShare6
上一篇

別讓 AI 接管你的社交生活

下一篇

WordPress 6.9.1 釋出,修復 49 項錯誤,準備邁向 7.0 新時代

BabyQ

BabyQ

IT 工程師,專長是資訊系統管理、企業 AI Infra、雲端服務,協助客戶解決問題。 Switch 轉 Steam 新手用戶,夢想是看極光、大堡礁、冰山、熔岩等地球美景。

相關文章

NVIDIA DGX Spark 從單機推進至四節點,AI 電腦叢集讓 Agent 基礎設施成形
AI 人工智慧

NVIDIA DGX Spark 從單機推進至四節點,AI 電腦叢集讓 Agent 基礎設施成形

2026 年 3 月 21 日
ComfyUI v0.18.0 繼續最佳化 VRAM 並全面升級多精度支援
AI 人工智慧

ComfyUI v0.18.0 繼續最佳化 VRAM 並全面升級多精度支援

2026 年 3 月 21 日
25 億美元 AI 算力走私案:美超微高層落網背後的 NVIDIA GPU 黑市與魔改產業鏈
新聞

25 億美元 AI 算力走私案:美超微高層落網背後的 NVIDIA GPU 黑市與魔改產業鏈

2026 年 3 月 20 日
邁向卡爾達肖夫二型文明?SpaceX、Starcloud與藍色起源的太空資料中心爭霸戰
AI 人工智慧

邁向卡爾達肖夫二型文明?SpaceX、Starcloud與藍色起源的太空資料中心爭霸戰

2026 年 3 月 20 日
Google 宣布 Firebase Studio 將於 2027 走入歷史,AI 開發全面轉向 Antigravity 與 AI Studio
AI 人工智慧

Google 宣布 Firebase Studio 將於 2027 走入歷史,AI 開發全面轉向 Antigravity 與 AI Studio

2026 年 3 月 20 日
NVIDIA 全新 KVTC 技術讓大語言模型記憶體用量銳減 20 倍,解析KV Cache 最佳化技術與市場趨勢
AI 人工智慧

NVIDIA 全新 KVTC 技術讓大語言模型記憶體用量銳減 20 倍,解析KV Cache 最佳化技術與市場趨勢

2026 年 3 月 20 日
下一篇
WordPress 6.9.1 釋出,修復 49 項錯誤,準備邁向 7.0 新時代

WordPress 6.9.1 釋出,修復 49 項錯誤,準備邁向 7.0 新時代

Moltbook 爆紅背後的資料外洩與人為操弄危機

Moltbook 爆紅背後的資料外洩與人為操弄危機

推薦閱讀

NVIDIA DGX Spark 從單機推進至四節點,AI 電腦叢集讓 Agent 基礎設施成形

NVIDIA DGX Spark 從單機推進至四節點,AI 電腦叢集讓 Agent 基礎設施成形

2026 年 3 月 21 日
ComfyUI v0.18.0 繼續最佳化 VRAM 並全面升級多精度支援

ComfyUI v0.18.0 繼續最佳化 VRAM 並全面升級多精度支援

2026 年 3 月 21 日
25 億美元 AI 算力走私案:美超微高層落網背後的 NVIDIA GPU 黑市與魔改產業鏈

25 億美元 AI 算力走私案:美超微高層落網背後的 NVIDIA GPU 黑市與魔改產業鏈

2026 年 3 月 20 日
邁向卡爾達肖夫二型文明?SpaceX、Starcloud與藍色起源的太空資料中心爭霸戰

邁向卡爾達肖夫二型文明?SpaceX、Starcloud與藍色起源的太空資料中心爭霸戰

2026 年 3 月 20 日
Google 宣布 Firebase Studio 將於 2027 走入歷史,AI 開發全面轉向 Antigravity 與 AI Studio

Google 宣布 Firebase Studio 將於 2027 走入歷史,AI 開發全面轉向 Antigravity 與 AI Studio

2026 年 3 月 20 日

近期熱門

  • 邁向卡爾達肖夫二型文明?SpaceX、Starcloud與藍色起源的太空資料中心爭霸戰

    邁向卡爾達肖夫二型文明?SpaceX、Starcloud與藍色起源的太空資料中心爭霸戰

    188 shares
    Share 75 Tweet 47
  • NVIDIA 全新 KVTC 技術讓大語言模型記憶體用量銳減 20 倍,解析KV Cache 最佳化技術與市場趨勢

    184 shares
    Share 74 Tweet 46
  • Mistral Forge 打造企業專屬頂級 AI,同場加映 Mistral Small 4 與駐點科學家

    152 shares
    Share 61 Tweet 38
  • GitHub 趨勢週報 Vol.6 : OpenClaw 霸榜、Agent 滲透威脅與儲存庫智慧崛起

    147 shares
    Share 59 Tweet 37
  • 聚焦代理人電腦,AMD AI Max+ 本機部署 OpenClaw 對決 NVIDIA DGX Spark

    140 shares
    Share 56 Tweet 35
  • 打造終極資料堡壘,QNAP Local HA 結合 Remote DR 異地冷備援與 Airgap+ 實戰架構

    119 shares
    Share 48 Tweet 30
  • 實測 NemoClaw : NVIDIA 版龍蝦也開源!為 OpenClaw 打造企業級資安護欄

    110 shares
    Share 44 Tweet 28
  • 25 億美元 AI 算力走私案:美超微高層落網背後的 NVIDIA GPU 黑市與魔改產業鏈

    108 shares
    Share 43 Tweet 27
  • AGI 的終極考卷?Google DeepMind 發表人類十大認知分類評測框架與 20 萬美元懸賞

    106 shares
    Share 42 Tweet 27
  • Google 宣布 Firebase Studio 將於 2027 走入歷史,AI 開發全面轉向 Antigravity 與 AI Studio

    102 shares
    Share 41 Tweet 26

關於 CyberQ 賽博客

您的企業儲存、網路架構與資安科技好夥伴

專注於企業級網路與儲存環境建構、NAS 系統整合、資安解決方案與 AI 應用顧問服務,為您打造高可用、高安全、高效能的數位環境。

專業產業媒體 × 技術顧問團隊

我們關注新興科技趨勢,深入報導海內外產業動態,並結合多年實務經驗,提供量身打造的 IT 解決方案與精選內容。

我們提供的核心服務 : 

資安防護|網站開發與雲端服務|AI 導入與應用顧問|企業資訊環境建構|NAS 系統整合|數位內容產製|科技媒體|

CyberQ 致力於打造更智慧、更安全的數位未來。

新聞稿、採訪、授權、內容投訴、行銷合作、投稿刊登:[email protected]
廣告委刊、展覽會議、系統整合、資安顧問、業務提攜:[email protected]

Copyright ©2025 CyberQ.tw All Rights Reserved.

沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • AI 代理
  • 龍蝦
  • AI 應用實戰
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊

© 2025 CyberQ NAS、資安、資訊科技、AI應用的日常 關於 CyberQ 賽博客NAS 系統與電腦、手機一起的生活故事多年的系統整合與資訊安全經驗,協助智慧家居、小型工作室、辦公室與機構,導入更便利、更安全的資訊環境與應用。