CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • Docker / 容器
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 開箱測試
  • 選購指南
  • DR.Q 快問快答
  • 基礎教學
    • NAS 基礎設定
  • 展覽直擊
聯繫我們
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • Docker / 容器
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 開箱測試
  • 選購指南
  • DR.Q 快問快答
  • 基礎教學
    • NAS 基礎設定
  • 展覽直擊
沒有結果
觀看所有搜尋結果
CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
  • 新聞
  • 資安專區
  • AI 應用實戰
  • Docker / 容器
  • 進階應用
  • 開箱測試
  • 選購指南
  • DR.Q 快問快答
  • 基礎教學
  • 展覽直擊
首頁 新聞 AI 人工智慧

ComfyUI v0.12.0 正式發布,LLM 推論加速與記憶體最佳化

BabyQ by BabyQ
2026 年 02 月 03 日 19:05
閱讀時間: 3 分鐘
A A
ComfyUI v0.12.0 正式發布,LLM 推論加速與記憶體最佳化
2.8k
觀看數
分享到臉書分享到 X分享到Line分享到 Threads分享到 Linkedin

開源 AI 圖像生成的領導工具 ComfyUI 於本週正式釋出 v0.12.0 版本更新。本次更新在底層效能與生成式 AI 的跨領域整合繼續深化。對於長期關注本地端 AI 部署的開發者與創作者而言,這次更新最引人注目的莫過於對大型語言模型(LLM)推論速度的最佳化,以及針對 Windows 使用者長期詬病的記憶體溢出問題修復。

RELATED POSTS

KB5077181 更新釋出,Windows 11跨裝置接續功能升級、開始功能表新介面與 AI 模型整合

AI 醫療器材事故頻傳:手術室內的智慧科技是助力還是風險?

AI 數位永生引發倫理爭議 是撫慰人心還是二次傷害 ?

以下是 CyberQ 實測與彙整的 v0.12.0 版本更新重點分析:

導入 KV Cache 大幅提升 LLM 文字生成效率

在 v0.12.0 中,ComfyUI 開發團隊為 Llama 系列模型導入了 KV Cache(Key-Value Cache) 機制,是加速 LLM 推論的重要技術之一。

在過去的純文字生成節點中,模型在生成每一個新 Token 時,往往需要重新計算先前所有 Token 的注意力權重,這導致生成長文本時速度會呈指數級下降。KV Cache 的加入,讓系統能夠暫存先前計算過的 Key 與 Value 矩陣,這意味著在生成下一個字時,只需計算最新的部分即可。

當我們在 ComfyUI 工作流中整合了本地 LLM(例如用於擴寫 Prompt 或生成影片故事腳本),v0.12.0 的文字生成速度將會有顯著的提升,且我們實測它中,隨著生成文字長度的增加,效能差異會更明顯。

記憶體管理與 VRAM 最佳化

本次更新也針對硬體資源管理進行了多項底層修復,特別是解決了困擾許多 Windows 用戶的「共享記憶體溢出(Shared Memory Spilling)」問題。

過去在 VRAM 吃緊時,系統嘗試調用 Windows 共享記憶體可能導致效能驟降或崩潰,新版本有重新再最佳化這個機制,減少效能降低和崩潰的機率。

另外這次改版也降低了 RAM 佔用,同樣也修復了視訊記憶體 VRAM OOM 的問題,開發者 @rattus128 提交的修復大幅減少了模型加載時的 RAM 需求,並解決了特定情況下的 VRAM 記憶體不足(OOM)錯誤,這對於使用 8GB 或 12GB 顯示卡的用戶來說是一大福音。

新增節點與模型支援

除了底層最佳化,功能層面也有不少新增強化:

這次更新也導入了一些新的 AI 音樂生成模型的範本,很值得去嘗試看看。

新的 Qwen-Image 2512 Turbo 出圖速度極快,也是從 0.11.1 到 0.12.0 後的新增重點範本。

包括 Vidu 影片生成模型更新,新增對 Vidu Q3 模型的支援,並導入了 Extend(延伸)與 MultiFrame 多幀節點,提升了影片生成的連貫性與控制力。

Recraft 風格節點,新增 RecraftCreateStyleNode,這是更便捷的風格遷移和風格鎖定功能,對於追求風格一致性的創作者相當實用。

這次也整合了 HitPaw API 節點,官方持續注重與擴展第三方 API 生態,繼續提供更多樣化的圖像處理服務。

告別 OOM 的秘密武器是動態模型載入 (Adaptive Model Loading)

根據開發者 rattus128 在 PR #11845 的技術說明,v0.12.0 的記憶體最佳化並非僅是參數調整,而是引入了一套全新的 ModelPatcher 實作,其核心基於 comfy-aimdo 函式庫。這項更新帶來了兩個革命性的改變:

首先是智慧型 VRAM 談判機制 (Lazy Loading & Dynamic Negotiation) 的導入,新系統不再像過去那樣「預先估算」VRAM 用量,而是改採「延遲載入(Lazy Load)」策略。只有在模型真正開始推論(例如 KSampler 的第一步)時,系統才會根據當前顯卡狀態,動態決定要載入多少權重。最關鍵的是,如果推論過程中 VRAM 不足,新機制會趕在 OOM記憶體溢位崩潰發生前,自動將部分權重卸載(Offload)到系統記憶體,這讓許多原本會讓 VRAM 爆掉的大模型現在都能順利運行。

其次是 mmap 與 Commit Charge 的最佳化,針對 Windows 系統,開發者特別解決了 Commit Charge 耗盡的問題。在舊版中,模型權重會被完整載入到 RAM 中,這會擠壓作業系統的磁碟快取(Disk Cache)。 新版本利用 PyTorch 的 mmap(記憶體映射)特性,讓模型權重直接停留在磁碟映射區,不佔用實際的程式 RAM。這不僅大幅降低了 Windows 的記憶體壓力,更因為保留了磁碟快取,使得模型的「第二次讀取」速度幾乎是瞬間完成,解決了 Windows 共享記憶體洩漏導致的效能低落問題。

迭代更新快速有好有壞

ComfyUI 的更新頻率極高(距離 v0.11.1 僅數天),這雖然展現了開源社群的強大活力,但也伴隨著部分用戶的更新焦慮。社群中已有部分用戶反映,v0.12.0 的底層改動導致部分舊版自定義節點(Custom Nodes)失效。

CyberQ 建議,若是已經在進行穩定的生產專案,這部分可先建議暫緩更新,使用另一個獨立的環境進行測試後,確定你的工作流和自訂義節點沒問題後,正式生產環境就可以更新導入了。對於熱衷嘗試新技術的玩家來說,這次針對 LLM 與 VRAM 的最佳化絕對值得一試,我們實測了產圖和產影片的記憶體耗用程度比之前少了 5% 到 15% 左右。

ComfyUI v0.11.0 發布:全面支援 Zimage Omni 等多種新模型,VRAM 最佳化再突破
4 秒出圖!FLUX.2 klein 正式登場,實測 BFL 新一代開源生圖模型,支援 NVFP4 與 4B 商用版
ComfyUI v0.10.0 釋出,架構更新、工作模板與 UX 改善
新版ComfyUI v0.4.0 大幅降低 VRAM 用量
ComfyUI v0.3.76 新版搭配 NVIDIA DGX Spark 實戰 Z-Image Turbo 的效能揭密
標籤: ComfyUI
Share34Tweet21ShareShareShare6
上一篇

別讓 AI 接管你的社交生活

下一篇

WordPress 6.9.1 釋出,修復 49 項錯誤,準備邁向 7.0 新時代

BabyQ

BabyQ

IT 工程師,專長是資訊系統管理、企業 AI Infra、雲端服務,協助客戶解決問題。 Switch 轉 Steam 新手用戶,夢想是看極光、大堡礁、冰山、熔岩等地球美景。

相關文章

KB5077181 更新釋出,Windows 11跨裝置接續功能升級、開始功能表新介面與 AI 模型整合
新聞

KB5077181 更新釋出,Windows 11跨裝置接續功能升級、開始功能表新介面與 AI 模型整合

2026 年 2 月 11 日
AI 醫療器材事故頻傳:手術室內的智慧科技是助力還是風險?
AI 人工智慧

AI 醫療器材事故頻傳:手術室內的智慧科技是助力還是風險?

2026 年 2 月 11 日
AI 數位永生引發倫理爭議 是撫慰人心還是二次傷害 ?
AI 人工智慧

AI 數位永生引發倫理爭議 是撫慰人心還是二次傷害 ?

2026 年 2 月 10 日
Redis 8.4.1 修復個資(PII)日誌外洩與多項崩潰漏洞,建議立即評估升級
DevOps

Redis 8.4.1 修復個資(PII)日誌外洩與多項崩潰漏洞,建議立即評估升級

2026 年 2 月 9 日
Mistral AI 推出低延遲與高性價比的語音轉文字模型 Voxtral Transcribe 2
AI 人工智慧

Mistral AI 推出低延遲與高性價比的語音轉文字模型 Voxtral Transcribe 2

2026 年 2 月 9 日
GitHub 週報 Vol.1:Agentic AI 的「技能」與「終端機」革命
AI 人工智慧

GitHub 週報 Vol.1:Agentic AI 的「技能」與「終端機」革命

2026 年 2 月 8 日
下一篇
WordPress 6.9.1 釋出,修復 49 項錯誤,準備邁向 7.0 新時代

WordPress 6.9.1 釋出,修復 49 項錯誤,準備邁向 7.0 新時代

Moltbook 爆紅背後的資料外洩與人為操弄危機

Moltbook 爆紅背後的資料外洩與人為操弄危機

推薦閱讀

KB5077181 更新釋出,Windows 11跨裝置接續功能升級、開始功能表新介面與 AI 模型整合

KB5077181 更新釋出,Windows 11跨裝置接續功能升級、開始功能表新介面與 AI 模型整合

2026 年 2 月 11 日
AI 醫療器材事故頻傳:手術室內的智慧科技是助力還是風險?

AI 醫療器材事故頻傳:手術室內的智慧科技是助力還是風險?

2026 年 2 月 11 日
AI 數位永生引發倫理爭議 是撫慰人心還是二次傷害 ?

AI 數位永生引發倫理爭議 是撫慰人心還是二次傷害 ?

2026 年 2 月 10 日
SD-WAN + Airgap+ 打造異地備份 + 離線備份的黃金組合終極資料堡壘

SD-WAN + Airgap+ 打造異地備份 + 離線備份的黃金組合終極資料堡壘

2026 年 2 月 10 日
拒絕勒索軟體綁架你的備份!用 Airgap+ 實作自動化離線備份打造隱形的資料金庫

拒絕勒索軟體綁架你的備份!用 Airgap+ 實作自動化離線備份打造隱形的資料金庫

2026 年 2 月 10 日

近期熱門

  • NVIDIA DGX OS 7.4.0 釋出,實測 DGX Spark 體驗關鍵升級

    NVIDIA DGX OS 7.4.0 釋出,實測 DGX Spark 體驗關鍵升級

    308 shares
    Share 123 Tweet 77
  • Proxmox VE 9.1.5 更新讓 Ceph 20.2 Tentacle 預覽登場,改善資源檢視與大量操作邏輯

    243 shares
    Share 97 Tweet 61
  • OpenAI 推 Frontier 平台 瞄準企業資料整合與 AI 自動化

    241 shares
    Share 96 Tweet 60
  • 三種 OpenClaw 實機部署方式與完整資安指引

    238 shares
    Share 95 Tweet 60
  • Docker Engine 29.2.1 提高維護網路穩定性與底層組件更新

    232 shares
    Share 93 Tweet 58
  • Google AI 成長力道強勁超越 OpenAI,2026 年將豪擲1,850 億美元資本支出

    219 shares
    Share 88 Tweet 55
  • 2026 年 AI 部署趨勢:量子 AI、Agentic AI 與地端 / 混合雲運算全面導入的推論經濟學

    184 shares
    Share 74 Tweet 46
  • ChatGPT 5.3 與 Claude Opus 4.6 AI 新模型釋出與主流 AI API 價格總整理

    153 shares
    Share 61 Tweet 38
  • 斷電是 SSD 與硬碟殺手!電腦、NAS 與機房的 UPS 選購指南

    141 shares
    Share 56 Tweet 35
  • Claude 法律套件引發 SaaS 末日?

    127 shares
    Share 51 Tweet 32

關於 CyberQ 賽博客

您的企業儲存、網路架構與資安科技好夥伴

專注於企業級網路與儲存環境建構、NAS 系統整合、資安解決方案與 AI 應用顧問服務,為您打造高可用、高安全、高效能的數位環境。

專業產業媒體 × 技術顧問團隊

我們關注新興科技趨勢,深入報導海內外產業動態,並結合多年實務經驗,提供量身打造的 IT 解決方案與精選內容。

我們提供的核心服務 : 

資安防護|網站開發與雲端服務|AI 導入與應用顧問|企業資訊環境建構|NAS 系統整合|數位內容產製|科技媒體|

CyberQ 致力於打造更智慧、更安全的數位未來。

新聞稿、採訪、授權、內容投訴、行銷合作、投稿刊登:service@cyberq.tw
廣告委刊、展覽會議、系統整合、資安顧問、業務提攜:service@cyberq.tw

Copyright ©2025 CyberQ.tw All Rights Reserved.

沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • Docker / 容器
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 開箱測試
  • 選購指南
  • DR.Q 快問快答
  • 基礎教學
    • NAS 基礎設定
  • 展覽直擊

© 2025 CyberQ NAS、資安、資訊科技、AI應用的日常 關於 CyberQ 賽博客NAS 系統與電腦、手機一起的生活故事多年的系統整合與資訊安全經驗,協助智慧家居、小型工作室、辦公室與機構,導入更便利、更安全的資訊環境與應用。