在 NVIDIA GTC 大會上黃仁勳拋出「AI for Everyone」的願景後,我們終於迎來了這款震撼業界的產品。過去我們談到 DGX,想到的都是機櫃裡的龐然大物,但 CyberQ 最近在辦公桌上實測的,是代號「Spark」的微型 AI 超級電腦,由 NVIDIA 自行找合作夥伴生產的官方版,以及授權給 OEM 廠商生產的版本,而我們這次採購實測使用的是 ASUS Ascent GX10。
這不僅僅是一台 Mini PC,它是將 Grace Blackwell 架構濃縮進便當盒大小的工程優秀產品,CyberQ 在上個月拿到實機後,和合作夥伴分別測試了不同機型,並且在 NVIDIA 陸續釋出穩定套件與作業系統更新後,確認它的穩定性與運算效能,幫各位開箱,並展示如何透過 QNAP 的 10G 高速網路環境,將它打造成個人的微型 LLM 訓練與推論中心,以及購置這種 NVIDIA 授權 OEM 版本 GB10 相容機時,如果只有 1TB SSD 容量的版本,要怎樣擴充比較好? CyberQ 在下方提供三種建議方式,可視情況採用。
1、硬體開箱:精緻的工業設計
收到 ASUS Ascent GX10 的當下,不論是我們的工程師 BabyQ 或執行長都驚艷到了,因為體積真的很小。它的外盒採用黑色霧面設計,搭配 NVIDIA 標誌性的綠色封條與雷射全像箔片印刷,低調中帶著 AI 算力小宇宙就在它小小身形中的氣息。價位上,NVIDIA 官方版 GB10 大概要十幾萬,OEM 版本不論是華碩或微星的 1TB 產品,售價都是十萬左右,4TB版本的機器價格就和 NVIDIA 官方版類似了。

包裝盒上清楚標示了核心規格:NVIDIA GB10 (Grace Blackwell Superchip)、128GB LPDDR5x 統一記憶體。
打開包裝,全金屬 CNC 切割的機身映入眼簾。不同於一般塑膠殼的迷你電腦,GX10 的手感極為紮實,金屬格柵設計不僅是為了美觀,更是為了應付 GB10 晶片的高效散熱需求。

機身正面簡約,僅有 ASUS Logo 與電源鍵,金屬質感極佳。
驚人的 I/O 配置
翻到背面,這裡才是讓業界關注且開心的地方。在這麼小的體積下,NVIDIA 與 OEM 夥伴們都設法在設計中塞進了 NVIDIA ConnectX-7 SmartNIC,並考量到散熱的問題。

網路: 雙埠 ConnectX-7 (支援高頻寬低延遲互連) + 10G RJ45 乙太網路孔。
顯示: HDMI 輸出。
擴充: 雙 USB4 (Type-C) 與 USB-A 介面。
這意味著這台機器天生就是為了叢集運算(Cluster)設計的,你可以輕易地將多台 GX10 串聯,不僅僅是單機作業,只要兩台 GB10 彼此用光纖線材連接彼此的 NVIDIA ConnectX-7 SmartNIC 連接埠,就能以 200Gb/s 的傳輸速度串聯,組成 256GB 記憶體容量的運算叢集,使用的 AI 模型就可以用更大參數的版本。
2、核心架構:Grace Blackwell GB10
這台 GX10 運行的核心是聯發科的 ARM 架構處理器 (Cortex-X925 10核心處理器 + Cortex-A725 10核心處理器 的 ARM 架構組合),搭配 NVIDIA GB10 GPU。
最關鍵的是那 128GB LPDDR5x Coherent Unified System Memory。在 AI 領域,記憶體頻寬與容量往往比算力更珍貴。統一記憶體 (Unified Memory) 讓 CPU 與 GPU 共享同一塊記憶體池,模型載入時無需在兩者間搬運資料,這對於執行大型語言模型(LLM)或進行大場景圖片生成計算或影片計算來說,能夠被順利載入才是重要的。

Accelerated by NVIDIA,這張綠色貼紙代表著 AI 邊緣運算認證。機身採用鋁金屬打造,散熱方面的配置也很好。

華碩這款 GX10 採用台達電 Delta 的 240W 電源供應器,支援 USB PD3.1 規格,提供穩定的輸出給這款 NVIDIA DGX SPARK。
3、基礎設施需要採購與配置,QNAP 高速儲存與交換器擔任後援
網路環境與儲存設備則是需要一起搭配考量和配置的,在辦公室與工作室的 AI 運算環境,我們比較關心的是硬碟、SSD 或網路的傳輸和等待,也就是 IO 瓶頸。為了讓 GB10 能順利擴充容量,以較高的速度來連線取得儲存設備上的資料資源,用一般的 1G 網路絕對不夠,而有足夠算購買 200Gb/s 交換器的公司,通常也不會擔心要買多少台 GB10 或用怎樣的高速全快閃儲存設備來擴充 AI 算力叢集的儲存硬體設備。
但是一般中小型公司,頂多買兩台 GB10 設備做堆疊成一個小 AI 算力叢集,不太容易添購 買 200GB/s 交換器,所以比較經濟實惠的選擇自然就是購買 10GB 等級交換器。
這次我們的測試環境,特別選用了 QNAP QSW-M2106-4S 作為網路骨幹。這是一台具備 10GbE SFP+ 與 2.5GbE RJ45 的網管型 Switch,可更順利地搭配 GX10 的高速網路介面,它除了 NVIDIA ConnectX-7 SmartNIC 200Gb 網路連接埠,也有台灣廠商瑞昱 Realtek 的 10 GbE 連接埠。

ASUS Ascent GX10 疊放在白色的 QNAP QSW-M2106-4S交換器上,透過 SFP+ 與 RJ45 建構高速資料通道,GX 10 的 10GbE 網路就透過電連接埠轉光連接埠的模組 (電轉光模組),連接上這款 10Gb 交換器,目前這種電轉光模組有比較不發熱發燙的版本了,推薦可以在市面上採購使用 Realtek 新晶片的解決方案,會比普通的電轉光模組更低溫一點,可省掉比較多的熱。
至於光口到光口的連接埠,可以使用上圖中右下角的連接線,就更不會有熱度,是完全低溫低功耗進行的,也是 CyberQ 推薦的 10Gb 網路方案之一。上圖中的 4 個 10Gb 連接埠都被使用了,分別是桌機、QNAP NAS、ASUS Ascent GX10,以及另一款 10GbE 網路交換器在連接使用中。

而在儲存端,我們透過 SSH 連線進去 CyberQ 使用的這台 DGX Spark ,下指令去掛載了 QNAP TS-855X NAS,透過 NFS 4.1 / NFS 4 協定將大型訓練資料集(Dataset)與模型權重檔(Weights)直接掛載到 GX10 的工作目錄下。
這樣的架構優勢在於:
資料不落地: 訓練資料集中管理在 NAS,安全且方便備份,如果你還有電腦上的 NVIDIA GPU 顯卡、NAS 上的專業 GPU 顯卡等多個 AI 運算節點的話,大家可以同時存取同一組掛載好的 NAS 硬碟磁區,只要維護這個資料夾的硬碟模型就好,你在 Windows 電腦上下載好的模型,放到資料夾,其他幾台 AI 運算節點,包括 GB10、GX10 都能夠使用同一個資料夾的 AI 模型去進行載入,省空間。
高速存取: 透過 10G 網路,讀取速度接近這台 ASUS GX10 本機上的 1TB SSD,即時推論載入模型與輸出結果存檔時不會卡頓。
如何在 NVIDIA DGX Spark / ASUS Ascent GX10 上掛載 NFS 請參考這一篇 :
第三種便宜擴充容量的方法,就是透過 GB10 / GX10 上的 USB-C 介面擴充外接 SSD 或外接硬碟,這是最簡單方便的,但缺點就是如果你有多 AI 運算節點,或者是你要從你自己的桌機或筆電把檔案交給 GB10 / GX10,不用區域網路傳的話,就得拔插這個外接式 SSD 或硬碟,使用上可以考慮一下。
4、軟體體驗:原生的 DGX OS

開機後,上圖顯示迎接我們的是熟悉的 Ubuntu 24.04.3 LTS,但核心已經由 NVIDIA 深度客製化(Linux 6.11.0-1016-nvidia,最新版則已經更新到 6.14.0-1013-nvidia aarch64)。系統資訊呈現是 ASUS GX10, Ubuntu 24.04, 128GB RAM,背景是瀏覽器上的 CyberQ 官方網站網頁。
DGX Dashboard
NVIDIA 內建了一個非常直觀的 Web 管理介面,DGX Dashboard。不用下指令就能監控 GPU 使用率、記憶體佔用(目前閒置約 26GB,還有 100GB+ 可用,這對跑 Llama-3 70B 來說綽綽有餘,也可以執行gpt-oss-120b)。

Web 介面一目了然,可以看到記憶體與 GPU 的即時負載,圖中下方也顯示我們是透過 10Gb 網路在連線,標示 10,000 Mb/s。
JupyterLab 開箱即用
對於開發者來說,最棒的是它預載了完整的 AI Stack。點擊 Dashboard 上的 JupyterLab,直接進入開發環境。不需要煩惱 CUDA 版本、不需要搞 Docker 環境變數,NVIDIA 已經幫你把 Pytorch、TensorFlow 和相關的 Library 都最佳化好了。

熟悉的 JupyterLab 介面,直接開始寫 Python,開始進行寫程式進行生產囉。
5、實測感想與各種應用搭配的地端 AI 運算
CyberQ 實測的感想是 ASUS GX 10 在散熱上做得不錯,整機是鋁機身外,風扇的配置和一些散熱的巧思也有做到,這是很重要的。在我們的測試過程中,GPU滿載時,GB10 的溫度是有可能變高的,機身兩側與後面散熱風扇的出風口都有一定程度的熱風,實際上有額外風扇來加速帶走這些熱會是更好的,但沒有的話,這款還是很穩定地輸出 AI 相關工作沒問題。
由於 1TB 記憶體,有人會覺得不夠用,因此我們透過 前述的 NFS 方式掛載了 1X TB 的硬碟空間給 GX 10 來使用,容量一下子擴充了十幾倍,因此開發者有人說,買 1TB 規格機種的 CP 值比較高,把買 4TB 機種的錢省下來,拿去買一台內建 10GbE 網路連接埠的 QNAP NAS 是不錯的,容量變大也可以順便做更多其他的事情,網路交換器可以買便宜的 4 Port 10GbE 版本,或市場上最低價的 2 Port 10GbE,但要留意品牌, CyberQ 實測不同 10 GbE 交換器,有些便宜品牌的機器穩定度就不如大廠的版本。
另一個擴充這台機器上的儲存空間方式是更換 SSD ,它原本的 1TB SSD 是 Phison 主控晶片的版本,只是因為 GB10、GX10 這些機器留給 SSD 的空間很小,只有 2230 這種短版規格的 SSD 可以插,因此你要升級就得去買 2230 M.2 規格的 2TB、4TB SSD 來用。但最近可參考我們報導的 SSD 和 DRAM 因為 AI 需求而大幅漲價的報導,現階段 2TB 2230 M.2 規格的 SSD 要價都在新台幣 5,000 元以上, 4TB 規格的話,從之前的 8,000 元,現在都要一萬多元才買得到,有想要透過這種方式提升容量的人可以再想一下。

在 CyberQ 與合作夥伴們的測試中,包括 SGLang、Ollama、ComfyUI、Blender 等等,確定這款機器都是跑得動的。得益於 CUDA 與 OptiX 的硬體加速,加上 128GB 的統一記憶體架構,一些應用的執行或搭配的地端 AI 運算都很值得利用。

CyberQ 在這台 ASUS GX10 上測試的 AI 模型包括 Gemma 3、GPT-OSS、Qwen 3、Qwen-Image等等,輸出的表現雖然不如 NVIDIA RTX 5090/5080,但是也算是 RTX 5070 水準了,不論是模擬多人共用、單機模型微調、訓練與推論等任務都可以做,實際測試都有每秒 40 到 66 不等的tokens速度,但我們覺得以它的低功耗來看,它更適合以訓練和微調為主的任務,才不愧對它的大容量記憶體和低耗電量,至於要快速推論的 GPU ,還是用 RTX 5090 (但記憶體不夠大,只能跑GPT-OSS 20B,速度是GX10的快三倍左右)、RTX 6000 這些產品吧,以及 NVIDIA 給企業用的 DGX 更高級系列機會更適合。
ASUS Ascent GX10 (DGX Spark) 填補了「開發者筆電」與「機房伺服器」之間需要的產品,它讓我們每一位資料科學家、程式設計師、資安研究員,都能在辦公桌上擁有一個專屬的 AI 實驗室。
本文圖片與硬體、技術細節均基於實機測試





