CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • 首頁
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • AI 代理
  • 龍蝦
  • AI 應用實戰
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊
聯繫我們
  • 首頁
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • AI 代理
  • 龍蝦
  • AI 應用實戰
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊
沒有結果
觀看所有搜尋結果
CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • 首頁
  • 新聞
  • AI 代理
  • 龍蝦
  • AI 應用實戰
  • 資安
  • Docker
  • 進階應用
  • 網通
  • NAS
  • 開箱測試
  • 教學
  • 展覽直擊
首頁 新聞 AI 人工智慧

LPU 市場將起飛 ? Nvidia 斥資 200 億美元取得 Groq 技術授權強化 AI 推論佈局

Ashley Hsieh by Ashley Hsieh
2025 年 12 月 26 日 08:00
閱讀時間: 2 分鐘
A A
LPU 市場將起飛 ? Nvidia 斥資 200 億美元取得 Groq 技術授權強化 AI 推論佈局
8.5k
觀看數
分享到臉書分享到 X分享到Line分享到 Threads分享到 Linkedin

根據 Silicon Angle 相關報導指出,AI 晶片大廠 Nvidia 並非如外界稍早預測將收購新創公司 Groq,而是選擇以約 200 億美元的規模,取得 Groq 的關鍵技術授權。這顯示了 Nvidia 執行長黃仁勳正在重新調整戰略,試圖在穩固 GPU 於 AI 訓練市場的統治地位後,進一步補強在即時推論領域的技術缺口,目標瞄準在適合推論的 LPU。

RELATED POSTS

Google I/O 2026 重點:Google 把 Gemini 推向代理式 AI 時代,搜尋、工作、開發與商務全面改寫

AI 已經突破科技圈邊界

Google I/O 2026:Gemini 新介面改版,Deep Think 納入可自訂思考程度

非收購而是技術結盟 瞄準推論市場瓶頸

早前市場傳言 Nvidia 將收購 Groq,但最新的消息指出,這是一種以技術授權為核心的合作模式,而非傳統意義上的併購交易。這項佈局被部分分析師形容為具有「捕獲並扼殺」(Catch and Kill)意味的策略運用。Nvidia 透過此舉巧妙避開了直接併購可能引發的反壟斷審查,卻能取得關鍵技術與人才,進而強化自身的AI晶片生態系。同時 Groq 維持形式上的獨立,讓市場上看似存在,但其實質上的威脅性已遭到削弱。

Groq 發新聞稿對外說明,該公司已經和Nvidia達成非獨家授權協議,而 Groq 創辦人Jonathan Ross、總裁 Sunny Madra 與 Groq團隊重要成員都將加入 Nvidia,且 Groq 會繼續獨立經營。

對於 Nvidia 而言,這是重要的布局。雖然 Nvidia 的 GPU 在模型訓練與高吞吐量運算上擁有絕對優勢,但在面對需要極低延遲的「單一使用者即時推論」場景時,傳統GPU架構仍面臨物理上的挑戰。透過整合 Groq 的技術,Nvidia 嘗試在未來架構中更明確區分預填充(Prefill)與解碼(Decode)等不同推論階段的運算特性,鞏固其在 AI 硬體產業的全方位領導地位。

NVIDIA 取得 Groq 技術授權後,產生了一種新的「接力賽」分工模式:

第一棒(理解)由擅長平行運算的 NVIDIA GPU 負責處理輸入資料的「預填充」(Prefill)。

第二棒(生成)將資料交棒給整合了 Groq 技術(LPU 架構)的晶片模組,負責高速的「解碼」(Decode)與回應生成 。 這種架構讓 AI 伺服器既能保有 GPU 的高吞吐量優勢,又能透過 LPU 技術補強即時推論的低延遲缺口,形成軟硬體整合的生態系循環 。

解構 LPU 與 GPU 及 TPU 的核心差異

要理解這項交易的重要性,必須先釐清 Groq 開發的 LPU 與傳統 GPU 及 Google TPU 在設計哲學上的根本差異。這三者雖然都用於 AI 運算,但其核心架構決定了各自擅長的戰場。

LPU 是專為大型語言模型(LLM)的推論過程而設計。其最大特色在於捨棄了 GPU 常用的高頻寬記憶體(HBM)作為主要權重存取來源,而是以大量晶片內部的 SRAM 承擔核心資料存取角色。這項設計如同將資料直接放在運算單元旁邊,大幅降低對外部記憶體存取的時間成本,因此在處理速度上極快,特別適合語音即時翻譯等需要即時反應的應用。

相較之下,Nvidia 的 GPU 採用 SIMT(單指令多執行緒)架構與 HBM 記憶體,這讓 GPU 擁有極大的記憶體容量與平行運算的吞吐量,非常適合需要處理海量資料的模型訓練階段。而 Google 的 TPU 則採用脈動陣列(Systolic Array)架構,專精於矩陣運算,是 Google 為了自身雲端服務的大規模運算所打造的專用晶片。

簡單來說,若將 AI 運算比喻為交通運輸,GPU 像是載貨量巨大的火車,適合一次運送大量物資;LPU 則像是追求極速的高鐵,專注於以最短時間將乘客直達終點。

Groq Compiler 編譯器的優異架構

Groq技術之所以能達成極致的低延遲,硬體架構只是基礎,真正的靈魂在於其軟體定義硬體的核心思維,也就是 Groq Compiler(編譯器)。

在傳統GPU運作中,硬體需要透過複雜的調度器動態指揮資料流向,這容易產生無法預期的延遲。然而 Groq Compiler 在程式開始執行前,就會將資料分切成小塊進而分配位置,甚至規畫詳細路徑,換言之,在編譯階段就已經完整規劃所有指令執行順序與資料流動的次序。

這是一種確定性(Deterministic)的運作模式。晶片內部不需要紅綠燈或交通警察來指揮交通,只需要在原地等待資料過來,因為所有的資料傳輸都已在編譯階段就已經排好時刻表,這種以軟體主導的排程方式,大幅降低對即時硬體調度的依賴的設計,讓 LPU 能展現出驚人的執行效率與速度,也是 Nvidia 極欲獲取的關鍵技術之一。

互補長短 未來AI運算的黃金組合

CyberQ 認為,Nvidia 此舉是為了構建未來的混合運算架構。未來的 AI 伺服器可能不再單純依賴 GPU,而是採用分工模式。由擅長平行運算的Nvidia GPU負責處理輸入資料的理解與預填充(Prefill),再交由整合了 Groq 技術的晶片負責高速生成回應(Decode)。

這項高額且具策略意義的投資布局,不僅再次驗證了 Groq LPU 技術架構的價值,更顯示 Nvidia 在防堵競爭對手超車的策略上,展現了極高的執行力與前瞻性。對於追求即時互動體驗的 AI 應用開發者而言,這將開啟應用生態系與產業的新局。

首圖由 Nano Banana AI 生成

GPU、LPU、TPU 各擅其場的 AI 算力賽局,解析技術差異及供應鏈佈局
AI 算力戰白熱化!Anthropic 豪擲數百億美元,向 Google 採購百萬顆 TPU 來組建規模 1 GW 的 AI 算力
Google 計畫結盟 Meta 與 AMD 強化自研 AI 晶片生態系
從 MLPerf 看 AI 算力版圖:NVIDIA 穩守江山,Google TPU 憑「能效」劍指 2026
甲骨文債信揭開矽谷 AI 大廠交互投資的高槓桿遊戲
微軟、輝達與Anthropic結盟 450億美元AI算力交易震撼市場
標籤: AIAI推論Catch and KillGPUGroqLPUNVIDIATPU晶片架構
Share102Tweet64ShareShareShare18
上一篇

Proxmox VE 9.1.4 系列新版本改善 Bulk、Snapshot 與 ACME 流程

下一篇

GPU、LPU、TPU 各擅其場的 AI 算力賽局,解析技術差異及供應鏈佈局

Ashley Hsieh

Ashley Hsieh

專案管理者與 UI/UX 設計、AI美術設計認證、淨零碳規劃管理師,在上市歐洲外商、生醫、金融、科技產業中淬煉,曾參與過多個跨平台專案,從需求分析、設計、使用者測試到專案交付流程都樂在其中。 私底下,我是一位「喜歡買東西但錢包容易抗議」的人,對科技、設計與藝術有熱情,正在努力平衡質感生活,學習和錢包一起成長的日常小練習者。

相關文章

Google I/O 2026 重點:Google 把 Gemini 推向代理式 AI 時代,搜尋、工作、開發與商務全面改寫
AI 人工智慧

Google I/O 2026 重點:Google 把 Gemini 推向代理式 AI 時代,搜尋、工作、開發與商務全面改寫

2026 年 5 月 20 日
AI 已經突破科技圈邊界
AI 人工智慧

AI 已經突破科技圈邊界

2026 年 5 月 20 日
Google I/O 2026:Gemini 新介面改版,Deep Think 納入可自訂思考程度
AI 人工智慧

Google I/O 2026:Gemini 新介面改版,Deep Think 納入可自訂思考程度

2026 年 5 月 20 日
馬斯克控告 OpenAI 敗訴 IPO 障礙已清除
AI 人工智慧

馬斯克控告 OpenAI 敗訴 IPO 障礙已清除

2026 年 5 月 19 日
GitHub 趨勢周報 Vol.15:AI Agent 技能市集化爆發,個人 AI、研究助理與地端語音模型成為本週開源主軸
新聞

GitHub 趨勢周報 Vol.15:AI Agent 技能市集化爆發,個人 AI、研究助理與地端語音模型成為本週開源主軸

2026 年 5 月 19 日
Google 前執行長演講遭噓,年輕世代對 AI 反感加劇
AI 人工智慧

Google 前執行長演講遭噓,年輕世代對 AI 反感加劇

2026 年 5 月 19 日
下一篇
GPU、LPU、TPU 各擅其場的 AI 算力賽局,解析技術差異及供應鏈佈局

GPU、LPU、TPU 各擅其場的 AI 算力賽局,解析技術差異及供應鏈佈局

當「凡走過必留痕跡」恐成為傳說 ? 數位衰退與 AI 獵食下的記憶保存危機

當「凡走過必留痕跡」恐成為傳說 ? 數位衰退與 AI 獵食下的記憶保存危機

推薦閱讀

Google I/O 2026 重點:Google 把 Gemini 推向代理式 AI 時代,搜尋、工作、開發與商務全面改寫

Google I/O 2026 重點:Google 把 Gemini 推向代理式 AI 時代,搜尋、工作、開發與商務全面改寫

2026 年 5 月 20 日
AI 已經突破科技圈邊界

AI 已經突破科技圈邊界

2026 年 5 月 20 日
Google I/O 2026:Gemini 新介面改版,Deep Think 納入可自訂思考程度

Google I/O 2026:Gemini 新介面改版,Deep Think 納入可自訂思考程度

2026 年 5 月 20 日
馬斯克控告 OpenAI 敗訴 IPO 障礙已清除

馬斯克控告 OpenAI 敗訴 IPO 障礙已清除

2026 年 5 月 19 日
GitHub 趨勢周報 Vol.15:AI Agent 技能市集化爆發,個人 AI、研究助理與地端語音模型成為本週開源主軸

GitHub 趨勢周報 Vol.15:AI Agent 技能市集化爆發,個人 AI、研究助理與地端語音模型成為本週開源主軸

2026 年 5 月 19 日

近期熱門

  • ds4 實作指引,128GB 記憶體機器搭配 NAS + Ollama 建立可落地的地端推論工作流

    ds4 實作指引,128GB 記憶體機器搭配 NAS + Ollama 建立可落地的地端推論工作流

    189 shares
    Share 76 Tweet 47
  • 透過 AI Skills 最佳化公文與論文流程

    140 shares
    Share 56 Tweet 35
  • GitHub 趨勢周報 Vol.15:AI Agent 技能市集化爆發,個人 AI、研究助理與地端語音模型成為本週開源主軸

    139 shares
    Share 56 Tweet 35
  • 買 NAS 不只是備份,QNAP Virtualization Station 如何把 NAS 變成輕量級虛擬化平台

    136 shares
    Share 54 Tweet 34
  • Fragnesia 再揭 Linux 核心提權風險:Dirty Frag 同類攻擊面,低權限使用者可能取得 root

    134 shares
    Share 54 Tweet 34
  • Pwn2Own Berlin 2026 戰況 DEVCORE領先與大廠防護焦點

    116 shares
    Share 46 Tweet 29
  • Nature 最新研究指出國家媒體控制如何影響大型語言模型

    107 shares
    Share 43 Tweet 27
  • 馬斯克控告 OpenAI 敗訴 IPO 障礙已清除

    103 shares
    Share 41 Tweet 26
  • Virtualization Station 與其它 VM 的差異

    103 shares
    Share 41 Tweet 26
  • 跨點備份免搞網路設定!QNAP QuWAN Express 輕量級 VPN,打造 NAS 異地互聯的無痛救星

    96 shares
    Share 38 Tweet 24

關於 CyberQ 賽博客

CyberQ 賽博客網站的命名正是 Cyber + Q ,是賽博網路、資訊、共識 / 高可用叢集、量子科技與品質的綜合體。

我們專注於企業級網路與儲存環境建構、NAS 系統整合、資安解決方案與 AI 應用顧問服務。透過以下三大面向的「Q」核心元素,我們為您提供從基礎架構到資料智慧的雙引擎驅動力:

Quorum 與 Quantum-safe

在技術架構上,是基於信任的基礎架構,CyberQ 深入掌握分散式系統中的 Quorum(一致性)、Queue(任務調度) 與 QoS(服務品質),以 Quick(效率) 解決複雜的 IT 與資安問題。同時,我們積極投入 Quantum-safe(後量子密碼學) 等新興資安領域,確保企業基礎設施在未來運算時代具備堅不可摧的長期競爭力。

Query 與 Quotient

CyberQ 是協助企業成長的 AI 引擎,在堅韌的架構之上,我們透過 Query(洞察) 解析大量資料,並以 Quotient(提升企業科技智商) 的顧問服務,將 AI 導入本機端環境與自動化工作流程中,將資料轉化為企業最具價值的數位資產。

Quest與 Quantum Leap

專業媒體與技術顧問是我們的核心雙動能。

作為科技媒體,我們秉持駭客精神持續進行科技 Quest(探索),探索海內外產業動態。

作為顧問團隊,我們結合多年第一線實務經驗,提供量身打造的最佳化解決方案,協助企業完成數位轉型的 Quantum Leap(躍進)。

新聞稿、採訪、授權、內容投訴、行銷合作、投稿刊登:[email protected]
廣告委刊、展覽會議、系統整合、資安顧問、業務提攜:[email protected]

Copyright ©2026 CyberQ.tw All Rights Reserved.

沒有結果
觀看所有搜尋結果
  • 首頁
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • AI 代理
  • 龍蝦
  • AI 應用實戰
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊

© 2025 CyberQ NAS、資安、資訊科技、AI應用的日常 關於 CyberQ 賽博客 NAS 系統與電腦、手機一起的生活故事 多年的系統整合與資訊安全經驗,協助智慧家居、小型工作室、辦公室與機構,導入更便利、更安全的資訊環境與應用。