CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • Docker / 容器
    • 虛擬化
  • 基礎教學
    • NAS 基礎設定
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
聯繫我們
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • Docker / 容器
    • 虛擬化
  • 基礎教學
    • NAS 基礎設定
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
沒有結果
觀看所有搜尋結果
CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
  • 新聞
  • 資安專區
  • AI 應用實戰
  • Docker / 容器
  • 基礎教學
  • 進階應用
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
首頁 新聞 AI 人工智慧

AWS reInvent 2025發表 Trainium3 晶片與UltraServer 算力與 AI 應用全面升級

Ashley Hsieh by Ashley Hsieh
2025 年 12 月 3 日
閱讀時間: 3 分鐘
A A
AWS reInvent 2025發表 Trainium3 晶片與UltraServer 算力與 AI 應用全面升級
19
分享數
380
觀看數
分享到臉書分享到 X分享到Line分享到 Threads分享到 Linkedin

AWS 在 2025 年的 re:Invent 大會上發布了多項涵蓋運算硬體、AI 模型與儲存服務的重大更新。歷經前一代 AI 晶片產品後,AWS 這次將硬體焦點集中在最新一代 AI 晶片 Trainium3 及其搭配的 UltraServer 伺服器,同時也針對軟體定義的 AI 代理人(AI Agents)與資料儲存架構進行了調整更新,自然是想辦法要在 AI 算力中心各家積極布局競爭的時局,鞏固 AWS 在雲端基礎設施的領先地位。

RELATED POSTS

Cloudflare 再傳災情!12/5 儀表板與 API 服務異常,FB、X與 Shopify 等重要網站平台一度受波及

怎樣在辦公室網路封鎖小紅書 ? 個人如何突破封鎖小紅書攻防實戰

從 MLPerf 看 AI 算力版圖:NVIDIA 穩守江山,Google TPU 憑「能效」劍指 2026

CyberQ 推薦看一下 AWS 這次活動的 Keynote 演講影片。

首款 3 奈米製程 AI 晶片 Trainium3 問世

Trainium3 是 AWS 首款採用 3 奈米製程技術打造的 AI 晶片。相較於前一代 Trainium2,新晶片在架構設計上有顯著突破。我們可以將其優勢區分為兩個不同層面來看:

大幅降低研發成本:在 AI 模型的「訓練」階段,重點在於算力的總量與耗電量。Trainium3 提供了高達 4.4 倍的運算效能提升,同時在能源效率上也增加了 4 倍。對於需要長時間運算的大型公司而言,這代表能用更短的時間、更少的電力完成模型開發,直接解決了最昂貴的研發成本問題。

最佳化即時互動體驗:當模型實際上線並開始服務使用者時,AI 「推論」的反應速度與服務量能成為關鍵指標。根據測試資料顯示,Trainium3 相較於前一代的回應延遲(Latency)已大幅縮減,速度快了 4 倍;同時單一晶片的吞吐量(Throughput)也提升了 3 倍。換言之,使用者能更快速地獲得 AI 回覆,而採用的公司,也能在同一時間內能服務更多的客戶。

UltraServer 伺服器整合144顆晶片

為了充分發揮 Trainium3 的效能,AWS 同步推出了全新的 Trainium3 UltraServer 伺服器。這款伺服器採用高度整合的垂直設計,單一系統內最多可封裝 144 顆 Trainium3 晶片。這種高密度的配置,旨在解決分散式 AI 運算中常見的通訊瓶頸。

UltraServer 配備了新一代的 NeuronSwitch-v1,網路傳輸的頻寬是前一代的兩倍。透過強化的 Neuron Fabric 網路技術,晶片之間的通訊延遲被壓低至 10 微秒以內。這對於需要大量資料交換的集合專家模型(MoE)或代理人系統(Agentic AI)來說,是至關重要的硬體優勢。

擴大與NVIDIA合作並推出混合雲方案

儘管 AWS 大力推動自研 AI 晶片,但其策略仍保持多元開放。大會中也同步發表了搭載 NVIDIA GB300 NVL72 架構的 P6e-GB300 UltraServer,這是目前 EC2 上配備最高 GPU 記憶體與算力的執行個體,專為兆級參數模型的即時推論所設計。

此外,針對有資料落地需求的客戶,AWS 推出了「AWS AI Factories」,允許企業在自有的資料中心內,部署包含 NVIDIA GPU 或 Trainium 晶片的 AWS 專用 AI 基礎設施,兼顧了雲端技術的便利性與地端部署的合規性,這樣一來雲地結合的要素會比以往更齊備。

AI 模型與 Frontier Agents 代理人新紀元

在軟體與模型層面,AWS 宣布擴充 Amazon Nova 模型家族,並推出了「Nova Forge」功能,完全客製化結合企業自有資料與 Nova 的預訓練模型。更引人注目的是全新推出的「Frontier Agents」,這是一類能自主運作數天且無需人工干預的 AI 代理人。

首波發布的三款代理人包括:

Kiro Autonomous Agent:扮演虛擬開發者角色。
AWS Security Agent:擔任資安顧問。
AWS DevOps Agent:負責維運操作。

這些 AI 代理人能與新發布的 Amazon Bedrock AgentCore 搭配使用,協助開發者管理 AI 的行為邊界與記憶功能。另外,AWS Transform 服務也加入了 Agentic AI 能力,號稱能加速舊有程式碼現代化的速度達 5 倍之多。

儲存與開發工具的關鍵更新

為了支撐龐大的 AI 資料處理需求,AWS 也對儲存服務進行了多項最佳化。新發布的 Amazon S3 Vectors 讓使用者能直接在 S3 物件儲存並查詢向量資料,單一索引支援高達 20 億個向量,大幅簡化 RAG 應用開發。S3 的單一物件大小上限從 5TB 提升至 50TB,能夠容納高解析度影片或巨型訓練資料集。S3 Batch Operations 的處理速度也提升了 10 倍。

至於在開發工具方面,AWS Lambda 推出了 Durable Functions,這是一項允許函式在執行過程中暫停並保存狀態長達一年的功能,非常適合處理付款流程或是需要更長週期的 AI 工作流。在資安方面,GuardDuty 的威脅偵測範圍也進一步擴大至 EC2 與 ECS 環境。

預告 Trainium4 晶片將支援 NVLink Fusion 技術

在發表 Trainium3 的同時,AWS 也提前預告了下一代晶片 Trainium4 的開發藍圖。Trainium4 預計將在效能上帶來更顯著的提升,目標是提供比 Trainium3 高出 6 倍的 FP4 處理效能,以及 3 倍的 FP8 效能。

值得注意的是,AWS 透露 Trainium4 將設計支援 NVIDIA 的 NVLink Fusion 高速互連技術。這項策略性的技術整合,將使得 Trainium4、Graviton 處理器以及 EFA 網路卡能在通用的 MGX 機架架構下無縫協作,為未來的 AI 資料中心提供更具彈性的混合算力選擇。

建構全方位的AI運算生態系

CyberQ 觀察,AWS 在 2025 年的佈局展現了其在 AI 基礎設施領域的野心。從底層的 Trainium3 自研晶片與 UltraServer 算力堆疊,到上層的 Frontier Agents 應用開發,以及支撐這一切的 S3 資料儲存架構,AWS 正透過軟硬體整合來降低 AI 開發的門檻。

AWS 新發布的 AI 代理三傑,Kiro Autonomous Agent、AWS Security Agent、AWS DevOps Agent,對市場的影響很值得留意。

我們如果看 AWS 執行長 Matt Garman 在開幕主題演講中說的:「Agentic AI 將成為企業真正釋放AI價值的關鍵,未來貢獻佔比將達80%至90%。」未來這方面的發展很值得繼續關注與投資,各家在這部份的競逐,會有技術力和實作能力的顯著差異,競爭態勢自然就能分得出來,對於 AI 應用開發者和廠商而言,這是個快速變動的時代,技術選型和生態系的導入是否正確或跟得上,都考驗業者和開發者們的智慧。

面對激烈的市場競爭,AWS 既強化自有硬體的成本優勢,也保持對NVIDIA 生態系的開放支援。隨著 AI 應用逐漸從單純的模型訓練轉向更複雜的自主代理人系統,這些基礎設施的升級將成為未來幾年推動技術創新的關鍵動力。

本文題圖 Google Gemini AI 生成

OpenAI 與 AWS 攜手重構 380 億美元雲端 AI 算力版圖
甲骨文債信揭開矽谷 AI 大廠交互投資的高槓桿遊戲
AWS US-EAST-1 異常掀全球災情:Snapchat、Canva、Duolingo、Fortnite 全掛,陸續恢復上線
AWS US-EAST-1 美東機房大當機,眾多重量級服務網站掛點的啟示
微軟、輝達與Anthropic結盟 450億美元AI算力交易震撼市場
Cursor 宣布獲 Google、NVIDIA 注資 23 億美元 D 輪融資,AI 開發工具進入「百億估值」戰場
標籤: AIAI AgentAI 代理AmazonAWSAWS AI FactoriesNova ForgeNVIDIAS3 VectorsTPUTrainium3Trainium4UltraServer生成式AI雲端運算
Share8Tweet5ShareShareShare1
上一篇

Windows 11 KB5070311 預覽版更新釋出,深色模式終於全黑了,但多了一個惱人的白閃bug

下一篇

WordPress 6.9 Gene 正式發布,協作功能大躍進與給開發者的 AI 新功能

Ashley Hsieh

Ashley Hsieh

專案管理者與 UI/UX 設計、AI美術設計認證、淨零碳規劃管理師,在上市歐洲外商、生醫、金融、科技產業中淬煉,曾參與過多個跨平台專案,從需求分析、設計、使用者測試到專案交付流程都樂在其中。 私底下,我是一位「喜歡買東西但錢包容易抗議」的人,對科技、設計與藝術有熱情,正在努力平衡質感生活,學習和錢包一起成長的日常小練習者。

相關文章

Cloudflare 再傳災情!12/5 儀表板與 API 服務異常,FB、X與 Shopify 等重要網站平台一度受波及
新聞

Cloudflare 再傳災情!12/5 儀表板與 API 服務異常,FB、X與 Shopify 等重要網站平台一度受波及

2025 年 12 月 5 日
怎樣在辦公室網路封鎖小紅書 ? 個人如何突破封鎖小紅書攻防實戰
新聞

怎樣在辦公室網路封鎖小紅書 ? 個人如何突破封鎖小紅書攻防實戰

2025 年 12 月 5 日
從 MLPerf 看 AI 算力版圖:NVIDIA 穩守江山,Google TPU 憑「能效」劍指 2026
AI 人工智慧

從 MLPerf 看 AI 算力版圖:NVIDIA 穩守江山,Google TPU 憑「能效」劍指 2026

2025 年 12 月 5 日
小紅書遭台灣封鎖一年 風險累積下的必然處置
新聞

小紅書遭台灣封鎖一年 風險累積下的必然處置

2025 年 12 月 5 日
vLLM-Omni 推出,開源 AI 推論引擎新生態與 Ollama 的定位之爭
AI 人工智慧

vLLM-Omni 推出,開源 AI 推論引擎新生態與 Ollama 的定位之爭

2025 年 12 月 5 日
美光 Crucial 全力轉攻 AI 市場,將逐步關閉消費級 DRAM 與 SSD 產品線
AI 人工智慧

美光 Crucial 全力轉攻 AI 市場,將逐步關閉消費級 DRAM 與 SSD 產品線

2025 年 12 月 4 日
下一篇
WordPress 6.9 Gene 正式發布,協作功能大躍進與給開發者的 AI 新功能

WordPress 6.9 Gene 正式發布,協作功能大躍進與給開發者的 AI 新功能

特斯拉Optimus跑步畫面曝光 傳第三代將整合Grok AI

特斯拉Optimus跑步畫面曝光 傳第三代將整合Grok AI

推薦閱讀

Cloudflare 再傳災情!12/5 儀表板與 API 服務異常,FB、X與 Shopify 等重要網站平台一度受波及

Cloudflare 再傳災情!12/5 儀表板與 API 服務異常,FB、X與 Shopify 等重要網站平台一度受波及

2025 年 12 月 5 日
怎樣在辦公室網路封鎖小紅書 ? 個人如何突破封鎖小紅書攻防實戰

怎樣在辦公室網路封鎖小紅書 ? 個人如何突破封鎖小紅書攻防實戰

2025 年 12 月 5 日
從 MLPerf 看 AI 算力版圖:NVIDIA 穩守江山,Google TPU 憑「能效」劍指 2026

從 MLPerf 看 AI 算力版圖:NVIDIA 穩守江山,Google TPU 憑「能效」劍指 2026

2025 年 12 月 5 日

近期熱門

  • 開箱迷你 AI 超級電腦,ASUS Ascent GX10 (NVIDIA DGX Spark) 搭配 QNAP NAS 擴充可用空間

    開箱迷你 AI 超級電腦,ASUS Ascent GX10 (NVIDIA DGX Spark) 搭配 QNAP NAS 擴充可用空間

    157 shares
    Share 63 Tweet 39
  • 漲幅超越黃金!AI 熱潮引爆記憶體+SSD 缺貨漲價潮

    152 shares
    Share 61 Tweet 38
  • 用 Fail2Ban 阻斷惡意掃描與暴力破解,AI 伺服器、NAS、Docker、Homelab、雲端主機必備的輕量防禦

    145 shares
    Share 58 Tweet 36
  • 掛載 NFS ,以 DGX Spark 搭配 QNAP NAS 實作

    81 shares
    Share 32 Tweet 20
  • Windows 11 KB5070311 預覽版更新釋出,深色模式終於全黑了,但多了一個惱人的白閃bug

    70 shares
    Share 28 Tweet 18
  • 你的掃地機器人也能「被遙控」?工程師發現遠端停機指令與資安疑慮

    85 shares
    Share 34 Tweet 21
  • Z-Image Turbo AI 實測,當前最佳地端 AI 圖像生成模型

    67 shares
    Share 27 Tweet 17
  • ComfyUI v0.3.76 新版搭配 NVIDIA DGX Spark 實戰 Z-Image Turbo 的效能揭密

    63 shares
    Share 25 Tweet 16
  • 朝日集團拒付駭客贖金 191萬資料外洩釀物流癱瘓與財報延期

    42 shares
    Share 17 Tweet 11
  • Linux 6.18 正式釋出:追求穩定的新版 Linux LTS 候選核心

    41 shares
    Share 16 Tweet 10

關於 CyberQ 賽博客

您的企業儲存、網路架構與資安科技好夥伴

專注於企業級網路與儲存環境建構、NAS 系統整合、資安解決方案與 AI 應用顧問服務,為您打造高可用、高安全、高效能的數位環境。

專業產業媒體 × 技術顧問團隊

我們關注新興科技趨勢,深入報導海內外產業動態,並結合多年實務經驗,提供量身打造的 IT 解決方案與精選內容。

我們提供的核心服務 : 

資安防護|網站開發與雲端服務|AI 導入與應用顧問|企業資訊環境建構|NAS 系統整合|數位內容產製|科技媒體|

CyberQ 致力於打造更智慧、更安全的數位未來。

新聞稿、採訪、授權、內容投訴、行銷合作、投稿刊登:service@cyberq.tw
廣告委刊、展覽會議、系統整合、資安顧問、業務提攜:service@cyberq.tw

Copyright ©2025 CyberQ.tw All Rights Reserved.

沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • Docker / 容器
    • 虛擬化
  • 基礎教學
    • NAS 基礎設定
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊

© 2025 CyberQ NAS、資安、資訊科技、AI應用的日常 關於 CyberQ 賽博客NAS 系統與電腦、手機一起的生活故事多年的系統整合與資訊安全經驗,協助智慧家居、小型工作室、辦公室與機構,導入更便利、更安全的資訊環境與應用。