NVIDIA 迷你 AI 超級電腦工作站的軟體補完計畫
隨著 2026 年 2 月初 NVIDIA 正式推送 DGX OS 7.4.0,這款針對桌面級 AI 超級電腦DGX Spark(搭載 GB10 Grace Blackwell 超級晶片)的作業系統迎來了首次重大更新,之前 CyberQ 長期測試都是用 7.3.1 跑的。對開發者來說,我們可以在更新後獲得更好的硬體相容性與改善過的開發體驗囉。
CyberQ 實際測試實裝,為大家檢視 NVIDIA 這次更新的內容,實際上還是會有一些小問題要處理的。
- DGX OS ISO 7.4.0
- OS base: Ubuntu 24.04.3 LTS
- Integrates over-the-air (OTA) update functionality version 2 for the NVIDIA DGX Spark System.
- NVIDIA GPU drivers: Architecture GPU Driver x86_64 580.126.09 ARM64 (DGX GB200, DGX GB300) 580.126.09 ARM64 (DGX Spark) 580.126.09 (Canonical signed driver)
- Updated support for the NVIDIA DOCA™ Host package with the doca-ofed installation profile: Architecture DOCA Support x86_64ARM64 (DGX GB200, DGX GB300)ARM64 (DGX Spark)
- Inbox OFED 50.0-2
- No doca-ofed support
- The following changes were made to the repositories:
- Kernel: Architecture Kernel x86_64 6.8.0-90-generic ARM64 (DGX GB300, DGX GB200) 6.17.0-1008-nvidia-64k ARM64 (DGX Spark) 6.17.0-1008-nvidia
- CUDA Toolkit: 13.0 Update 2
- NCCL: 2.29.2
- cuDNN: 9.18.0
- DCGM: 4.5.0
- NVIDIA Container Toolkit: 1.18.2
- NVSM: 25.09.04
- Docker Engine: 29.1.3
- MIG Configuration Tool: 0.13.1
- DLFW: 25.12
從核心到開發環境的全面升級
根據官方發布的技術文件,DGX OS 7.4.0 的改進主要集中在「底層穩定性」與「開箱即用的 AI 環境」:

目前不同版本的 7.4.0 的核心還不同,CyberQ 用的機器仍然在 Linux Kernel 6.14 核心。由於核心相關的升級,都是重要的底層變動,對於 GB10 這種新架構晶片的排程最佳化與硬體相容性逐步會有提升,同時也解決了早期版本中部分周邊設備(如特定 USB-C 裝置或顯示器)連接不穩定的問題。
不過呢,正式版本的 DGX OS 7.4.0 針對 DGX Spark 採用了更新的 Linux Kernel 6.17.0-1008-nvidia,而非通用的 6.14 版本,這顯示官方針對 Grace Blackwell 架構也搭配 Ubuntu 24.04.3 LTS 的核心變更,繼續進行了適合這個架構處理器的核心層最佳化。

NVIDIA 顯示驅動程式方面則穩定採用 580.126.09 (Canonical signed),配合 CUDA 13.0 Update 2 提供最新的 AI 算力支援。值得注意的是,在網路堆疊部分,DGX Spark 目前採用 Inbox OFED 50.0-2,官方文件特別標註目前「尚未支援 doca-ofed」,這意味著習慣使用 DOCA 開發套件的資安或網管人員,在 Spark 平台上暫時需依賴 Inbox 驅動進行作業。

CUDA 13.0 與 PyTorch 的原生整合,新版 OS 直接整合了 CUDA 13.0 Update 2 與最新版 PyTorch。這對於開發者來說是一大福音,意味著在 JupyterLab 中進行 Stable Diffusion XL 等生成式 AI 任務時,不再需要繁瑣的環境配置。官方更特別修復了先前在 JupyterLab 中無法生成圖片的 Bug,讓 End-to-End 的工作流更加順暢。
不過,根據 NVIDIA 官方論壇的資料,部分用戶有更新驅動程式到 590.48.01,CUDA 版本也變更為 13.1,可能後續還會有別的更新,但目前官方版本的 DGX OS 7.4.0 仍舊以這份官方公布的規格為主。

記憶體報告修正(統一記憶體的迷思),DGX Spark 最大的賣點是 128GB 的統一記憶體(Unified Memory)。然而,舊版 Dashboard 的記憶體讀數經常與 CUDA 工具顯示的不一致,導致開發者誤判資源用量。7.4.0 終於修正了這個顯示邏輯,現在 Dashboard 的資料已與 CUDA 官方指引對齊。
OTA v2 更新機制,引入了第二代 Over-the-Air 更新功能,旨在解決系統更新時的「卡頓」與失敗率,這也是為了回應社群先前對於更新流程繁瑣的詬病。
期待與混亂並存
在 NVIDIA 開發者論壇上,針對 7.4.0 的討論在發布後隨即展開。目前的社群反應呈現「兩極化」:
在「分批推送」引發的焦慮中,用戶 jaim12005 在 NVIDIA 官方論壇發文詢問:「這是分批推送的嗎?(Is this rolling out in waves?)」許多持有合作夥伴版本硬體(如 MSI EdgeExpert 或 ASUS Ascent GX10)的用戶發現,即便官方 OS 已更新,他們的設備卻遲遲未偵測到升級。這衍生了關於「公版 DGX Spark」與「OEM 版本」軟體更新步調是否一致的討論。如果剛好手邊的設備非 NVIDIA 原廠公版,可能需要等待 OEM 廠商的額外驗證。CyberQ 的是 ASUS Ascent GX10 和公版 DGX Spark 都有,被推送更新的時間實測則是差不多,但是呢,在核心的部分則是不同步的。在我們的實測中,儘管官方 Release Notes 明確指出 DGX OS 7.4.0 的 DGX Spark 版本應搭載 Kernel 6.17.0-1008-nvidia,但 ASUS Ascent GX10 在執行完標準更新流程後,uname -r 依然回報為 6.14(這是 DGX OS 7.3.1 的核心版本)。
經過交叉比對社群回報,這可能有兩種原因,一個是套件相依性的緣故,所以在本次核心跨度較大(從 6.14 到 6.17)的情況下,一般的 apt upgrade 可能會為了保護現有設定而「保留(hold)」核心更新。
另一個可能是 OEM 版本的保護,或許對於 MSI EdgeExpert 或 ASUS Ascent GX10 的用戶,OEM 廠商可能為了確保其特規散熱或 I/O 控制器的穩定性之類的,暫時在軟體源中鎖定了核心版本,這也印證了論壇中關於「分批推送」的猜測,不然就是等 NVIDIA 官方分批推送後再看看情況吧。
下載與更新有零星災情出現,雖然這次 NVIDIA 針對 OTA v2 承諾改善大家的更新體驗,但仍有部分用戶回報 ISO 映像檔下載困難,甚至遭遇網頁連結失效的問題。另有部分用戶指出軟體更新過程耗時極長(Taking hours),顯示伺服器端或安裝腳本仍有最佳化空間。
另外一個地方值得留意,也就是 Canonical 簽章驅動,因為除了效能,這次 7.4.0 在資安合規上也做了一個低調的更新。針對 DGX Spark (ARM64) 的 GPU 驅動 580.126.09,官方特別標註為 Canonical signed driver,已通過 Ubuntu 發行商 Canonical 的數位簽章認證。對於需要在 UEFI Secure Boot(安全啟動) 開啟環境下部署 Edge AI 的企業用戶來說,解決了過去安裝 NVIDIA 驅動時需要手動註冊 MOK (Machine Owner Key) 的流程,簡化了高安全性環境的部署。
實測 30B 模型與硬體
撇開安裝問題,CyberQ 實際測試與大多數成功升級的用戶類似,開始在 DGX Spark 上進行壓力測試,目前的實測重點如下:
本地執行 30B 大模型是相對簡單的任務,DGX Spark 上執行 30B 參數量的 AWQ 4bit 量化模型,並結合 vLLM 與 Browser-Use 進行實測。得益於 128GB 的統一記憶體,這種級別的模型在 DGX Spark 上執行仍舊是相當流暢,繼續維持作為邊緣 AI 工作站的實力。
USB 與周邊相容性改善是有感的,我們實際發現新版對 USB Hub 的可用度有提升。另外,社群中關於「USB 埠供電與連線」的討論串(Some observation about DGX Spark usb ports)指出,新版本似乎改善了部分外接儲存裝置的掛載穩定度,這對於需要頻繁讀取大資料集的用戶來說還滿需要關注,抽拔 USB-C 外接盒的 SSD 會很好多。
效能監控的真實性,更新後的記憶體報告讓開發者能更精確地進行「Context Window」的壓力測試。我們可以測試隨著 Context 增長,模型的 Artifact(偽影/錯誤)生成率,這需要極度精確的記憶體監控,而 7.4.0 提供了更可信的資料基礎。
建議升級,但請留意硬體版本
DGX OS 7.4.0 是一個 DGX Spark 更成熟的新版本,CUDA 13 的原生支援與記憶體顯示修復,開發者可以實際感受和測試。
CyberQ 建議,如果是 NVIDIA 公版 DGX Spark 用戶,應該要先備份資料後盡快升級,獲得 Linux Kernel 6.14 / Linux Kernel 6.17 新版帶來的穩定性。
如果是 MSI/ASUS 等 OEM 版本用戶,如果擔心有風險可以等看看,觀察廠商是否釋出專屬韌體或驅動,減少刷公版 OS 後出現驅動不相容的風險。但目前 CyberQ 使用的 ASUS Ascent GX10 搭配 QNAP TS-855x 掛載 NFS 使用諸多 AI 工具和工作流相關的任務,都是沒問題就是了。
後續觀察我們會繼續留意 vLLM 等 AI 平台,在新版 Kernel 下的效能表現,以及 OEM 廠商對於 OS 更新的跟進速度。
另外,最近熱門的 OpenClaw ,在這台上面也能夠跑,但需要留意資安部署相關問題,避免資料外流與其他衍生問題。







