AI 繪圖領域的開源霸主 ComfyUI 日前正式釋出了里程碑版本 ComfyUI v0.4.0,更帶來了社群期盼已久的 VRAM 視訊記憶體最佳化,以及底層架構的重大革新。對於苦於硬體限制的創作者而言,這是一份提早到來的耶誕禮物;但對於依賴大量客製化節點(Custom Nodes)的進階玩家來說,這也是一次需要謹慎評估的升級。
以下是 CyberQ 在電腦、QANP NAS與 NVIDIA DGX SPARK 上實測的 ComfyUI v0.4.0 核心重點與分析。

上面這台是 CyberQ 在 NVIDIA DGX SPARK 上的 ComfyUI v0.4.0 實例

上面這台是 CyberQ 在 QNAP NAS TS-855X 上的 ComfyUI v0.4.0 實例
顯卡記憶體救星:Video Model 與 LoRA 的極致最佳化
本次更新最讓我們用戶們開心的莫過於對 VRAM(視訊記憶體) 的進一步改善,特別是以下這兩個方面的更新是重要的。
首先是時間滾動 VAE(Temporal Rolling VAE)的調整,新版 ComfyUI 針對 Hunyuan(混元) 和 Kandinsky 等 AI 影片模型,引入了時間滾動處理機制,大幅減少了影片生成時的顯示卡記憶體需求。這意味著原本只能在 24GB VRAM 卡上跑的流程 (如 NVIDIA RTX 4090),現在有機會在 16GB 甚至更低規格的顯示上執行。
Flux2 與 LoRA 最佳化: 針對熱門但非常耗用記憶體的 Flux2 模型,修復並減少了 OOM(記憶體不足)錯誤,並減少了 LoRA 的內存預留,這點在 CyberQ 使用機器上實測是證實的,之前確實比較常出現記憶體不足就直接當掉的情形,如今這情況就好很多。
圖實例是執行在 NVIDIA RTX A2000 的 ComfyUI ,12GB VRAM 顯示卡記憶體也可以分擔執行適合的任務。
模型支援重點更新 Kandinsky 5.0 與 Z-Image
ComfyUI 官方繼續展現出對市場上各種最新 AI 模型的快速跟進能力,包括:
Kandinsky 5.0: 全面支援這款強大的多模態模型,涵蓋文生影片(Text-to-Video)、圖生影片(Image-to-Video)及文生圖片等變體。
Ovis Image & Z-Image: 新增對 Ovis 多模態圖像模型及 Z-Image 的支援,並最佳化了時下最熱門模型 Z-Image 的 FP16 相容性,讓工作流更加順暢。支援Z-Image工作流的 transformer,LoRA前綴。
Alibaba PAI-Fun ControlNet: 正式支援阿里雲 PAI 團隊的 ControlNet,擴展了控圖的可能性。
另外,工作流與API增強的部分,包括將上下文窗口修復和增強的時序處理,Kling API @image引用格式,以及 ComfyUI-Manager pip 安裝支援。
V3 架構逐步遷移
ComfyUI 正在進行底層的更新工程。在 v0.4.0 中,大量的 3D、音訊(Audio)、Mask 編輯器及 freelunch 節點已被遷移至 V3 架構。
靈活性提升: 新增了 MatchType、DynamicCombo 和 Autogrow 支援,這將讓工作流的連接與擴展更具彈性,開發者能寫出更聰明的節點。
前端效能加速: 官方聲稱顯著改善了前端加載與啟動的效能,CyberQ 實測是有感的,並導入了 GPU 加速的 Mask 編輯器渲染,解決了過去編輯複雜遮罩時卡頓的問題。
市場反應相對正面
根據 Release 發布後的社群討論(Reddit、X 與 Discord 頻道),CyberQ 觀察到以下幾種主要聲音:
正面評價,效能優先
「終於不用換顯卡了!」,有不少使用消費級顯卡(如 RTX 3060/4060 Ti)的用戶對 VRAM 最佳化給予極高評價,特別是針對影片生成(Video Generation)的改善,被認為是讓 AI 影片創作進入「平民化」的關鍵一步,儘管在這樣的顯示卡上跑 AI 影片生成比較慢。
啟動速度有感讓許多用戶都反應出這點,在安裝了數百個節點的情況下,ComfyUI 的冷啟動速度有明顯提升,Web UI 的回應也更加順暢。
疑慮與災情出現在客製化節點的相容性危機
V3 架構的相容性陣痛問題已經浮現,由於核心節點大量遷移至 V3 架構,部分尚未更新的第三方 Custom Nodes 出現了報錯或無法連接的情況。社群中已有開發者呼籲:「如果你是生產環境用戶,請暫時不要升級,或務必做好備份!」
自動更新的雙面刃:桌面版(Desktop)用戶如果開啟了自動更新,可能會在不知情的情況下升級到 v0.4.0,導致原有工作流損壞。建議專業用戶暫時關閉自動更新,採取手動控制版本的策略。
ComfyUI v0.4.0 邁入新階段
CyberQ 認為 ComfyUI v0.4.0 是一個「必經的陣痛轉型期」。V3 架構雖然短期內會造成生態系的相容性混亂,但長遠來看,它解決了過去節點定義混亂、擴充性受限的問題。
以我們自己的測試來說,出圖時間平均加快了 15% – 20 %,秒數有減少,記憶體的用量也有更好的控制,是值得升級的。

上圖實例是執行在 NVIDIA RTX A2000 的 ComfyUI ,12GB VRAM 顯示卡記憶體也可以分擔執行適合的任務。
以下是我們實測後給用戶們的操作建議:
備份 (Snapshot): 在升級前,務必使用 ComfyUI-Manager 的 Snapshot 功能備份當前的環境與節點狀態。
建立獨立環境: 建議複製一份 ComfyUI 資料夾作為 v0.4.0 的測試沙盒,保留舊版 v0.3.x 作為穩定生產力工具。
關注節點更新: 密切鎖定你常用的 Custom Nodes 作者(如 Impact Pack, WAS Node 等)的 GitHub,確認他們是否已經修改跟進到 V3 架構。







