中國 AI DeepSeek V3.1 模型升級，強調本土晶片最佳化與效能提升

中國人工智慧新創公司 DeepSeek (深度求索)，在相隔將近五個月後，再次大幅更新了他們的 V3 基礎模型，推出了 DeepSeek V3.1。這次升級的亮點，在於它具備了針對中國本土製造晶片的最佳化功能，同時處理速度也更快了。

DeepSeek 對外指出，V3.1 模型採用了 UE8M0 FP8 精度格式。他們特別提到，這種格式是專門為「即將問世的下一代本土晶片」設計的。不過，該公司並沒有明確說明這項新功能具體支援哪些晶片型號或製造商。

模型進化與核心技術改善

這次是 DeepSeek 近期第三度進行模型更新。他們在今年三月先做了 V3 的早期強化，接著五月又發布了 R1 模型升級。DeepSeek-V3.1 對於分詞器和聊天模板（chat template）做了大調整，與 DeepSeek-V3 有明顯區別。

新版本的核心特色是採用了全新的混合推論架構，讓模型能在同一框架下同時支援「思考」模式（Think）與「非思考」模式。相較於其 R1 推論模型，V3.1 Think 模式能更快給出答案。

透過後訓練的最佳化，新模型在使用工具和執行代理任務方面的表現有顯著提升，甚至在 Aider 多語言程式編碼基準測試中，得分還超越了 Anthropic 的 Claude 4 Opus。

DeepSeek 表示，經過思維鏈壓縮訓練後，V3.1-Think 在輸出 Token 數量減少 20% 到 50% 的情況下，各項任務的平均表現仍與該公司之前發表的 R1-0528 版本差不多；而且在多項搜尋代理測試中表現更大幅提升，超越了 R1-0528。

API 更新與市場策略調整

目前，DeepSeek 官方的 App 和網頁版模型都已同步升級到 V3.1。此外，DeepSeek API（應用程式介面）也同時升級，相關文件說明於此，且上下文記憶容量全面擴展到 128K。這代表模型現在能處理更多資訊，具備更強大的記憶能力。新版本同時也新增支援 Anthropic API 格式，以簡化開發者從其他平台轉換過來的流程。

DeepSeek 聲明 V3.1 模型使用的 UE8M0 FP8 精度格式是針對下一代中國本土晶片所設計。據了解，UE8M0 FP8 並非 NVIDIA 官方的 FP8 標準，而是其一種變體格式。目前支援 FP8 的主要是 NVIDIA H 系列和 B 系列，而中國本土晶片中也已有明確支援 FP8 的產品問世。

國外媒體引述分析指出，DeepSeek 對中國本土晶片相容性的重視，可能顯示隨著北京在美國華府出口限制下持續開發美國技術的替代品，DeepSeek 正將其 AI 模型與中國不斷發展的半導體生態系統能接續起來。

另一方面，DeepSeek 宣布將於 9 月 6 號起實行新的 API 定價方案，並取消夜間優惠。外界普遍認為，這代表著在服務能力擴大後，慢慢開始走向商業化。

我們實際上去測試 API ，可以發現他們的價格競爭力還是有的，預估近期各大 AI 公司的 API 價格策略會有一番調整以符合市場競爭。

標籤: AI DeepSeek

中國 AI DeepSeek V3.1 模型升級，強調本土晶片最佳化與效能提升

審查員痛批一坨狗屎卻照樣放行？揭開微軟政府雲 (GCC High) 的 FedRAMP 審查黑幕

Mistral Forge 打造企業專屬頂級 AI，同場加映 Mistral Small 4 與駐點科學家

OpenAI 推出最強小模型 GPT-5.4 mini / nano，宣告 ALL IN 核心算力，將捨棄Sora！

LLM 模型的參數量與系統需求資源概要

2025台灣機器人與智慧自動化展揭示產業未來：NVIDIA引領 AI 浪潮，人形機器人、智慧製造與AI機器手臂成焦點

Ashley Hsieh

相關文章

審查員痛批一坨狗屎卻照樣放行？揭開微軟政府雲 (GCC High) 的 FedRAMP 審查黑幕

Mistral Forge 打造企業專屬頂級 AI，同場加映 Mistral Small 4 與駐點科學家

OpenAI 推出最強小模型 GPT-5.4 mini / nano，宣告 ALL IN 核心算力，將捨棄Sora！

AGI 的終極考卷？Google DeepMind 發表人類十大認知分類評測框架與 20 萬美元懸賞

實測 NemoClaw : NVIDIA 版龍蝦也開源！為 OpenClaw 打造企業級資安護欄

NVIDIA DLSS 5 於 GTC 2026 登場，究竟是繪圖技術的突破，還是破壞藝術風格的 AI 濾鏡 only？

2025台灣機器人與智慧自動化展揭示產業未來：NVIDIA引領 AI 浪潮，人形機器人、智慧製造與AI機器手臂成焦點

NVIDIA 下一盤好大的棋，用「Scale-Across」策略打造跨越地理限制的 AI

推薦閱讀

審查員痛批一坨狗屎卻照樣放行？揭開微軟政府雲 (GCC High) 的 FedRAMP 審查黑幕

Mistral Forge 打造企業專屬頂級 AI，同場加映 Mistral Small 4 與駐點科學家

OpenAI 推出最強小模型 GPT-5.4 mini / nano，宣告 ALL IN 核心算力，將捨棄Sora！

AGI 的終極考卷？Google DeepMind 發表人類十大認知分類評測框架與 20 萬美元懸賞

實測 NemoClaw : NVIDIA 版龍蝦也開源！為 OpenClaw 打造企業級資安護欄

近期熱門

Google 地圖整合 Gemini 模型全面進化導航與搜尋體驗

GitHub 趨勢週報 Vol.6 : OpenClaw 霸榜、Agent 滲透威脅與儲存庫智慧崛起

實測 NemoClaw : NVIDIA 版龍蝦也開源！為 OpenClaw 打造企業級資安護欄

AGI 的終極考卷？Google DeepMind 發表人類十大認知分類評測框架與 20 萬美元懸賞

為什麼 OpenClaw 是開源史上的ChatGPT 時刻？

NVIDIA DLSS 5 於 GTC 2026 登場，究竟是繪圖技術的突破，還是破壞藝術風格的 AI 濾鏡 only？

Claude 開放無痛移轉 ChatGPT 等 AI 平台用戶記憶資料，將 AI 記憶給自家設備或 NAS 託管的架構思考

ComfyUI v0.17 系列更新模組化升級與 Flux 2 klein kv 支援

美軍斥資兩百億美元攜手 Anduril 推動 AI 國防現代化

AI 究竟是神隊友還是飯碗殺手？Meta 傳大砍 20% 人力，2026 年的矽谷大廠 AI 裁員海嘯

關於 CyberQ 賽博客

中國 AI DeepSeek V3.1 模型升級，強調本土晶片最佳化與效能提升

RELATED POSTS

模型進化與核心技術改善

API 更新與市場策略調整

LLM 模型的參數量與系統需求資源概要

2025台灣機器人與智慧自動化展揭示產業未來：NVIDIA引領 AI 浪潮，人形機器人、智慧製造與AI機器手臂成焦點

相關文章

推薦閱讀

近期熱門

關於 CyberQ 賽博客