CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • AI 代理
  • 龍蝦
  • AI 應用實戰
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊
聯繫我們
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • AI 代理
  • 龍蝦
  • AI 應用實戰
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊
沒有結果
觀看所有搜尋結果
CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
  • 新聞
  • AI 代理
  • 龍蝦
  • AI 應用實戰
  • 資安
  • Docker
  • 進階應用
  • 網通
  • NAS
  • 開箱測試
  • 教學
  • 展覽直擊
首頁 新聞 AI 人工智慧

AWS reInvent 2025發表 Trainium3 晶片與UltraServer 算力與 AI 應用全面升級

Ashley Hsieh by Ashley Hsieh
2025 年 12 月 03 日 12:00
閱讀時間: 3 分鐘
A A
AWS reInvent 2025發表 Trainium3 晶片與UltraServer 算力與 AI 應用全面升級
1.1k
觀看數
分享到臉書分享到 X分享到Line分享到 Threads分享到 Linkedin

AWS 在 2025 年的 re:Invent 大會上發布了多項涵蓋運算硬體、AI 模型與儲存服務的重大更新。歷經前一代 AI 晶片產品後,AWS 這次將硬體焦點集中在最新一代 AI 晶片 Trainium3 及其搭配的 UltraServer 伺服器,同時也針對軟體定義的 AI 代理人(AI Agents)與資料儲存架構進行了調整更新,自然是想辦法要在 AI 算力中心各家積極布局競爭的時局,鞏固 AWS 在雲端基礎設施的領先地位。

RELATED POSTS

審查員痛批一坨狗屎卻照樣放行?揭開微軟政府雲 (GCC High) 的 FedRAMP 審查黑幕

Mistral Forge 打造企業專屬頂級 AI,同場加映 Mistral Small 4 與駐點科學家

OpenAI 推出最強小模型 GPT-5.4 mini / nano,宣告 ALL IN 核心算力,將捨棄Sora!

CyberQ 推薦看一下 AWS 這次活動的 Keynote 演講影片。

首款 3 奈米製程 AI 晶片 Trainium3 問世

Trainium3 是 AWS 首款採用 3 奈米製程技術打造的 AI 晶片。相較於前一代 Trainium2,新晶片在架構設計上有顯著突破。我們可以將其優勢區分為兩個不同層面來看:

大幅降低研發成本:在 AI 模型的「訓練」階段,重點在於算力的總量與耗電量。Trainium3 提供了高達 4.4 倍的運算效能提升,同時在能源效率上也增加了 4 倍。對於需要長時間運算的大型公司而言,這代表能用更短的時間、更少的電力完成模型開發,直接解決了最昂貴的研發成本問題。

最佳化即時互動體驗:當模型實際上線並開始服務使用者時,AI 「推論」的反應速度與服務量能成為關鍵指標。根據測試資料顯示,Trainium3 相較於前一代的回應延遲(Latency)已大幅縮減,速度快了 4 倍;同時單一晶片的吞吐量(Throughput)也提升了 3 倍。換言之,使用者能更快速地獲得 AI 回覆,而採用的公司,也能在同一時間內能服務更多的客戶。

UltraServer 伺服器整合144顆晶片

為了充分發揮 Trainium3 的效能,AWS 同步推出了全新的 Trainium3 UltraServer 伺服器。這款伺服器採用高度整合的垂直設計,單一系統內最多可封裝 144 顆 Trainium3 晶片。這種高密度的配置,旨在解決分散式 AI 運算中常見的通訊瓶頸。

UltraServer 配備了新一代的 NeuronSwitch-v1,網路傳輸的頻寬是前一代的兩倍。透過強化的 Neuron Fabric 網路技術,晶片之間的通訊延遲被壓低至 10 微秒以內。這對於需要大量資料交換的集合專家模型(MoE)或代理人系統(Agentic AI)來說,是至關重要的硬體優勢。

擴大與NVIDIA合作並推出混合雲方案

儘管 AWS 大力推動自研 AI 晶片,但其策略仍保持多元開放。大會中也同步發表了搭載 NVIDIA GB300 NVL72 架構的 P6e-GB300 UltraServer,這是目前 EC2 上配備最高 GPU 記憶體與算力的執行個體,專為兆級參數模型的即時推論所設計。

此外,針對有資料落地需求的客戶,AWS 推出了「AWS AI Factories」,允許企業在自有的資料中心內,部署包含 NVIDIA GPU 或 Trainium 晶片的 AWS 專用 AI 基礎設施,兼顧了雲端技術的便利性與地端部署的合規性,這樣一來雲地結合的要素會比以往更齊備。

AI 模型與 Frontier Agents 代理人新紀元

在軟體與模型層面,AWS 宣布擴充 Amazon Nova 模型家族,並推出了「Nova Forge」功能,完全客製化結合企業自有資料與 Nova 的預訓練模型。更引人注目的是全新推出的「Frontier Agents」,這是一類能自主運作數天且無需人工干預的 AI 代理人。

首波發布的三款代理人包括:

Kiro Autonomous Agent:扮演虛擬開發者角色。
AWS Security Agent:擔任資安顧問。
AWS DevOps Agent:負責維運操作。

這些 AI 代理人能與新發布的 Amazon Bedrock AgentCore 搭配使用,協助開發者管理 AI 的行為邊界與記憶功能。另外,AWS Transform 服務也加入了 Agentic AI 能力,號稱能加速舊有程式碼現代化的速度達 5 倍之多。

儲存與開發工具的關鍵更新

為了支撐龐大的 AI 資料處理需求,AWS 也對儲存服務進行了多項最佳化。新發布的 Amazon S3 Vectors 讓使用者能直接在 S3 物件儲存並查詢向量資料,單一索引支援高達 20 億個向量,大幅簡化 RAG 應用開發。S3 的單一物件大小上限從 5TB 提升至 50TB,能夠容納高解析度影片或巨型訓練資料集。S3 Batch Operations 的處理速度也提升了 10 倍。

至於在開發工具方面,AWS Lambda 推出了 Durable Functions,這是一項允許函式在執行過程中暫停並保存狀態長達一年的功能,非常適合處理付款流程或是需要更長週期的 AI 工作流。在資安方面,GuardDuty 的威脅偵測範圍也進一步擴大至 EC2 與 ECS 環境。

預告 Trainium4 晶片將支援 NVLink Fusion 技術

在發表 Trainium3 的同時,AWS 也提前預告了下一代晶片 Trainium4 的開發藍圖。Trainium4 預計將在效能上帶來更顯著的提升,目標是提供比 Trainium3 高出 6 倍的 FP4 處理效能,以及 3 倍的 FP8 效能。

值得注意的是,AWS 透露 Trainium4 將設計支援 NVIDIA 的 NVLink Fusion 高速互連技術。這項策略性的技術整合,將使得 Trainium4、Graviton 處理器以及 EFA 網路卡能在通用的 MGX 機架架構下無縫協作,為未來的 AI 資料中心提供更具彈性的混合算力選擇。

建構全方位的AI運算生態系

CyberQ 觀察,AWS 在 2025 年的佈局展現了其在 AI 基礎設施領域的野心。從底層的 Trainium3 自研晶片與 UltraServer 算力堆疊,到上層的 Frontier Agents 應用開發,以及支撐這一切的 S3 資料儲存架構,AWS 正透過軟硬體整合來降低 AI 開發的門檻。

AWS 新發布的 AI 代理三傑,Kiro Autonomous Agent、AWS Security Agent、AWS DevOps Agent,對市場的影響很值得留意。

我們如果看 AWS 執行長 Matt Garman 在開幕主題演講中說的:「Agentic AI 將成為企業真正釋放AI價值的關鍵,未來貢獻佔比將達80%至90%。」未來這方面的發展很值得繼續關注與投資,各家在這部份的競逐,會有技術力和實作能力的顯著差異,競爭態勢自然就能分得出來,對於 AI 應用開發者和廠商而言,這是個快速變動的時代,技術選型和生態系的導入是否正確或跟得上,都考驗業者和開發者們的智慧。

面對激烈的市場競爭,AWS 既強化自有硬體的成本優勢,也保持對NVIDIA 生態系的開放支援。隨著 AI 應用逐漸從單純的模型訓練轉向更複雜的自主代理人系統,這些基礎設施的升級將成為未來幾年推動技術創新的關鍵動力。

首圖 Google Gemini AI 生成

OpenAI 與 AWS 攜手重構 380 億美元雲端 AI 算力版圖
甲骨文債信揭開矽谷 AI 大廠交互投資的高槓桿遊戲
AWS US-EAST-1 異常掀全球災情:Snapchat、Canva、Duolingo、Fortnite 全掛,陸續恢復上線
AWS US-EAST-1 美東機房大當機,眾多重量級服務網站掛點的啟示
微軟、輝達與Anthropic結盟 450億美元AI算力交易震撼市場
Cursor 宣布獲 Google、NVIDIA 注資 23 億美元 D 輪融資,AI 開發工具進入「百億估值」戰場
標籤: AIAI AgentAI 代理AmazonAWSAWS AI FactoriesNova ForgeNVIDIAS3 VectorsTPUTrainium3Trainium4UltraServer生成式AI雲端運算
Share13Tweet8ShareShareShare2
上一篇

Windows 11 KB5070311 預覽版更新釋出,深色模式終於全黑了,但多了一個惱人的白閃bug

下一篇

WordPress 6.9 Gene 正式發布,協作功能大躍進與給開發者的 AI 新功能

Ashley Hsieh

Ashley Hsieh

專案管理者與 UI/UX 設計、AI美術設計認證、淨零碳規劃管理師,在上市歐洲外商、生醫、金融、科技產業中淬煉,曾參與過多個跨平台專案,從需求分析、設計、使用者測試到專案交付流程都樂在其中。 私底下,我是一位「喜歡買東西但錢包容易抗議」的人,對科技、設計與藝術有熱情,正在努力平衡質感生活,學習和錢包一起成長的日常小練習者。

相關文章

審查員痛批一坨狗屎卻照樣放行?揭開微軟政府雲 (GCC High) 的 FedRAMP 審查黑幕
新聞

審查員痛批一坨狗屎卻照樣放行?揭開微軟政府雲 (GCC High) 的 FedRAMP 審查黑幕

2026 年 3 月 19 日
Mistral Forge 打造企業專屬頂級 AI,同場加映 Mistral Small 4 與駐點科學家
AI 人工智慧

Mistral Forge 打造企業專屬頂級 AI,同場加映 Mistral Small 4 與駐點科學家

2026 年 3 月 19 日
OpenAI 推出最強小模型 GPT-5.4 mini / nano,宣告 ALL IN 核心算力,將捨棄Sora!
AI 人工智慧

OpenAI 推出最強小模型 GPT-5.4 mini / nano,宣告 ALL IN 核心算力,將捨棄Sora!

2026 年 3 月 19 日
AGI 的終極考卷?Google DeepMind 發表人類十大認知分類評測框架與 20 萬美元懸賞
AI 人工智慧

AGI 的終極考卷?Google DeepMind 發表人類十大認知分類評測框架與 20 萬美元懸賞

2026 年 3 月 18 日
實測 NemoClaw : NVIDIA 版龍蝦也開源!為 OpenClaw 打造企業級資安護欄
AI 人工智慧

實測 NemoClaw : NVIDIA 版龍蝦也開源!為 OpenClaw 打造企業級資安護欄

2026 年 3 月 18 日
NVIDIA DLSS 5 於 GTC 2026 登場,究竟是繪圖技術的突破,還是破壞藝術風格的 AI 濾鏡 only?
AI 人工智慧

NVIDIA DLSS 5 於 GTC 2026 登場,究竟是繪圖技術的突破,還是破壞藝術風格的 AI 濾鏡 only?

2026 年 3 月 17 日
下一篇
WordPress 6.9 Gene 正式發布,協作功能大躍進與給開發者的 AI 新功能

WordPress 6.9 Gene 正式發布,協作功能大躍進與給開發者的 AI 新功能

特斯拉Optimus跑步畫面曝光 傳第三代將整合Grok AI

特斯拉Optimus跑步畫面曝光 傳第三代將整合Grok AI

推薦閱讀

審查員痛批一坨狗屎卻照樣放行?揭開微軟政府雲 (GCC High) 的 FedRAMP 審查黑幕

審查員痛批一坨狗屎卻照樣放行?揭開微軟政府雲 (GCC High) 的 FedRAMP 審查黑幕

2026 年 3 月 19 日
Mistral Forge 打造企業專屬頂級 AI,同場加映 Mistral Small 4 與駐點科學家

Mistral Forge 打造企業專屬頂級 AI,同場加映 Mistral Small 4 與駐點科學家

2026 年 3 月 19 日
OpenAI 推出最強小模型 GPT-5.4 mini / nano,宣告 ALL IN 核心算力,將捨棄Sora!

OpenAI 推出最強小模型 GPT-5.4 mini / nano,宣告 ALL IN 核心算力,將捨棄Sora!

2026 年 3 月 19 日
AGI 的終極考卷?Google DeepMind 發表人類十大認知分類評測框架與 20 萬美元懸賞

AGI 的終極考卷?Google DeepMind 發表人類十大認知分類評測框架與 20 萬美元懸賞

2026 年 3 月 18 日
實測 NemoClaw : NVIDIA 版龍蝦也開源!為 OpenClaw 打造企業級資安護欄

實測 NemoClaw : NVIDIA 版龍蝦也開源!為 OpenClaw 打造企業級資安護欄

2026 年 3 月 18 日

近期熱門

  • Google 地圖整合 Gemini 模型全面進化導航與搜尋體驗

    Google 地圖整合 Gemini 模型全面進化導航與搜尋體驗

    169 shares
    Share 68 Tweet 42
  • GitHub 趨勢週報 Vol.6 : OpenClaw 霸榜、Agent 滲透威脅與儲存庫智慧崛起

    146 shares
    Share 58 Tweet 37
  • 實測 NemoClaw : NVIDIA 版龍蝦也開源!為 OpenClaw 打造企業級資安護欄

    105 shares
    Share 42 Tweet 26
  • AGI 的終極考卷?Google DeepMind 發表人類十大認知分類評測框架與 20 萬美元懸賞

    105 shares
    Share 42 Tweet 26
  • 為什麼 OpenClaw 是開源史上的ChatGPT 時刻?

    101 shares
    Share 40 Tweet 25
  • NVIDIA DLSS 5 於 GTC 2026 登場,究竟是繪圖技術的突破,還是破壞藝術風格的 AI 濾鏡 only?

    96 shares
    Share 38 Tweet 24
  • Claude 開放無痛移轉 ChatGPT 等 AI 平台用戶記憶資料,將 AI 記憶給自家設備或 NAS 託管的架構思考

    276 shares
    Share 110 Tweet 69
  • ComfyUI v0.17 系列更新模組化升級與 Flux 2 klein kv 支援

    82 shares
    Share 33 Tweet 21
  • 美軍斥資兩百億美元攜手 Anduril 推動 AI 國防現代化

    78 shares
    Share 31 Tweet 20
  • AI 究竟是神隊友還是飯碗殺手?Meta 傳大砍 20% 人力,2026 年的矽谷大廠 AI 裁員海嘯

    75 shares
    Share 30 Tweet 19

關於 CyberQ 賽博客

您的企業儲存、網路架構與資安科技好夥伴

專注於企業級網路與儲存環境建構、NAS 系統整合、資安解決方案與 AI 應用顧問服務,為您打造高可用、高安全、高效能的數位環境。

專業產業媒體 × 技術顧問團隊

我們關注新興科技趨勢,深入報導海內外產業動態,並結合多年實務經驗,提供量身打造的 IT 解決方案與精選內容。

我們提供的核心服務 : 

資安防護|網站開發與雲端服務|AI 導入與應用顧問|企業資訊環境建構|NAS 系統整合|數位內容產製|科技媒體|

CyberQ 致力於打造更智慧、更安全的數位未來。

新聞稿、採訪、授權、內容投訴、行銷合作、投稿刊登:[email protected]
廣告委刊、展覽會議、系統整合、資安顧問、業務提攜:[email protected]

Copyright ©2025 CyberQ.tw All Rights Reserved.

沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • AI 代理
  • 龍蝦
  • AI 應用實戰
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊

© 2025 CyberQ NAS、資安、資訊科技、AI應用的日常 關於 CyberQ 賽博客NAS 系統與電腦、手機一起的生活故事多年的系統整合與資訊安全經驗,協助智慧家居、小型工作室、辦公室與機構,導入更便利、更安全的資訊環境與應用。