在生成式 AI 的戰場上,影片生成(Video Generation)一直是算力需求相當高的 AI 應用,市場一直苦於 AI 影片生成需要的大量算力和能源。而日前來自中國清華大學機器學習組(THU-ML)的一項最新開源專案 TurboDiffusion,可說提出了一種解法,市場正在檢視與測試觀察中。
該專案宣稱能將影片擴散模型的推理速度提升 100 至 205 倍,在保持畫質幾乎無損的情況下,讓原本需要近 3 分鐘生成的影片,縮短至 1.8 秒 完成。
核心技術如何達成 200 倍加速?
根據官方 GitHub 與技術報告指出,TurboDiffusion 並非單純依賴硬體堆疊,而是透過一套「軟硬整合」的加速框架來達成此壯舉。

( Figure Credit: TurboDiffusion )
其核心技術重點還包括:
極致的蒸餾技術 (rCM Distillation): 團隊使用了最新的 rCM (Consistency Model) 蒸餾技術,成功將原本動輒數十步的採樣過程,大幅壓縮至僅需 3 到 4 步。這意味著 GPU 需要計算的次數直接減少了一個數量級。
混合精度量化 (W8A8 Quantization): 針對線性層(Linear Layers),TurboDiffusion 引入了 INT8 量化,這不僅大幅降低了 VRAM 顯示卡記憶體的耗用程度,更充分利用了新款代 GPU(如 NVIDIA RTX 40/50 系列)的 Tensor Cores 進行整數運算加速。
稀疏注意力機制 (Sparse Attention): 針對長序列影片生成的痛點,該框架整合了 SageSLA / SpargeAttn 等稀疏注意力演算法,有效減少了注意力機制的計算冗餘。
實戰表現測試用 Wan 2.1 (萬相) 模型
值得注意的是,TurboDiffusion 目前主要支援並加速的是 Wan 2.1 (Wanx 2.1) 系列模型。這是一款近期備受矚目的開源影片生成模型,以其強大的中文理解與物理模擬能力著稱。用 Wan 更新的版本,如 2.2 在上面也支援,後續版本在未來的發展不容小覷。
實際測試的情況是,在原始速度時,生成一個 5 秒的 480P 影片(Wan-2.1-T2V-1.3B)約需 166 秒。
但是拿 Turbo 速度來比較,使用 TurboDiffusion 後,同規格影片生成僅需 1.8 秒。
硬體門檻方面,CyberQ 觀察,雖然官方測試使用了旗艦級的 RTX 5090,但其 1.3B 參數版本被證實可在消費級顯卡上流暢運行,這對於本地端 AI 創作者來說是巨大的福音。
目前可取得的 TurboWan 系列模型
| Model Name | Checkpoint Link | Best Resolution |
|---|---|---|
TurboWan2.1-T2V-1.3B-480P | Huggingface Model | 480p |
TurboWan2.1-T2V-14B-480P | Huggingface Model | 480p |
TurboWan2.1-T2V-14B-720P | Huggingface Model | 720p |
TurboWan2.2-I2V-A14B-720P | Huggingface Model | 720p |
社群震撼與市場期待
儘管該專案才剛上線不久,但已在開源社群引起了不小的轟動。
CyberQ 觀察, TurboDiffusion GitHub 頁面 的 Star 數還在成長中,部分開發者們對於能將「分鐘級」等待變成「秒級」回饋感到不可思議。
也可以看一下社群討論區和 Issues:TurboDiffusion GitHub Issues 與討論區
本地部署的 AI 影片模型會更好部署,在 Reddit 與 X (Twitter) 的 AI 開發者社群中,許多人將其視為 「影片生成的 SDXL Turbo 時刻」。過去 Stable Diffusion Turbo 的出現讓靜態圖片生成進入了即時時代,而 TurboDiffusion 似乎正在為動態影片複製這一歷史進程。
對硬體廠商的啟示則在於繼續開發好的演算法,隨著 RTX 50 系列顯卡的上市,這類針對特定硬體架構最佳化的演算法(如利用 INT8 Tensor Cores),將成為未來 AI 軟體最佳化的主流方向。單純的「暴力運算」已不再是唯一解,演算法效率的最佳化才是落地的關鍵。
CyberQ 認為 TurboDiffusion 的意義不僅在於「快」,更在於它降低了影片創作的試錯成本。當生成一段影片只需要 2 秒時,創作者可以快速迭代 Prompt,嘗試不同的運鏡與風格,若搭配 ComfyUI 等類似工作流管理工具和平台,這將徹底改變 AI 影片的創作工作流。
我們將持續追蹤該專案的後續更新,特別是未來是否會支援更多主流模型(如 Sora 或其他開源變體)。
相關連結:
技術報告: TurboDiffusion Technical Report
基礎模型: Wan 2.x








