中國 AI DeepSeek V3.1 模型升級，強調本土晶片最佳化與效能提升

中國人工智慧新創公司 DeepSeek (深度求索)，在相隔將近五個月後，再次大幅更新了他們的 V3 基礎模型，推出了 DeepSeek V3.1。這次升級的亮點，在於它具備了針對中國本土製造晶片的最佳化功能，同時處理速度也更快了。

DeepSeek V4 Flash 正式版成績不俗且成本僅 Gemini 的 1/19，開放權重挑戰閉源 AI

FCC 擴大設備禁令海外先進機器人與電源逆變器入列

AI Agent 失控連環爆：OpenAI 與 Anthropic 模型雙雙突破隔離｜Thinking Machines 縮小模型受矚目｜產業精選 08.01

DeepSeek 對外指出，V3.1 模型採用了 UE8M0 FP8 精度格式。他們特別提到，這種格式是專門為「即將問世的下一代本土晶片」設計的。不過，該公司並沒有明確說明這項新功能具體支援哪些晶片型號或製造商。

模型進化與核心技術改善

這次是 DeepSeek 近期第三度進行模型更新。他們在今年三月先做了 V3 的早期強化，接著五月又發布了 R1 模型升級。DeepSeek-V3.1 對於分詞器和聊天模板（chat template）做了大調整，與 DeepSeek-V3 有明顯區別。

新版本的核心特色是採用了全新的混合推論架構，讓模型能在同一框架下同時支援「思考」模式（Think）與「非思考」模式。相較於其 R1 推論模型，V3.1 Think 模式能更快給出答案。

透過後訓練的最佳化，新模型在使用工具和執行代理任務方面的表現有顯著提升，甚至在 Aider 多語言程式編碼基準測試中，得分還超越了 Anthropic 的 Claude 4 Opus。

DeepSeek 表示，經過思維鏈壓縮訓練後，V3.1-Think 在輸出 Token 數量減少 20% 到 50% 的情況下，各項任務的平均表現仍與該公司之前發表的 R1-0528 版本差不多；而且在多項搜尋代理測試中表現更大幅提升，超越了 R1-0528。

API 更新與市場策略調整

目前，DeepSeek 官方的 App 和網頁版模型都已同步升級到 V3.1。此外，DeepSeek API（應用程式介面）也同時升級，相關文件說明於此，且上下文記憶容量全面擴展到 128K。這代表模型現在能處理更多資訊，具備更強大的記憶能力。新版本同時也新增支援 Anthropic API 格式，以簡化開發者從其他平台轉換過來的流程。

DeepSeek 聲明 V3.1 模型使用的 UE8M0 FP8 精度格式是針對下一代中國本土晶片所設計。據了解，UE8M0 FP8 並非 NVIDIA 官方的 FP8 標準，而是其一種變體格式。目前支援 FP8 的主要是 NVIDIA H 系列和 B 系列，而中國本土晶片中也已有明確支援 FP8 的產品問世。

國外媒體引述分析指出，DeepSeek 對中國本土晶片相容性的重視，可能顯示隨著北京在美國華府出口限制下持續開發美國技術的替代品，DeepSeek 正將其 AI 模型與中國不斷發展的半導體生態系統能接續起來。

另一方面，DeepSeek 宣布將於 9 月 6 號起實行新的 API 定價方案，並取消夜間優惠。外界普遍認為，這代表著在服務能力擴大後，慢慢開始走向商業化。

我們實際上去測試 API ，可以發現他們的價格競爭力還是有的，預估近期各大 AI 公司的 API 價格策略會有一番調整以符合市場競爭。

標籤: AI DeepSeek

中國 AI DeepSeek V3.1 模型升級，強調本土晶片最佳化與效能提升

DeepSeek V4 Flash 正式版成績不俗且成本僅 Gemini 的 1/19，開放權重挑戰閉源 AI

FCC 擴大設備禁令海外先進機器人與電源逆變器入列

AI Agent 失控連環爆：OpenAI 與 Anthropic 模型雙雙突破隔離｜Thinking Machines 縮小模型受矚目｜產業精選 08.01

LLM 模型的參數量與系統需求資源概要

2025台灣機器人與智慧自動化展揭示產業未來：NVIDIA引領 AI 浪潮，人形機器人、智慧製造與AI機器手臂成焦點

Ashley Hsieh

相關文章

DeepSeek V4 Flash 正式版成績不俗且成本僅 Gemini 的 1/19，開放權重挑戰閉源 AI

FCC 擴大設備禁令海外先進機器人與電源逆變器入列

AI Agent 失控連環爆：OpenAI 與 Anthropic 模型雙雙突破隔離｜Thinking Machines 縮小模型受矚目｜產業精選 08.01

Anthropic安全評估出包三款Claude模型誤駭三家組織系統

Apple 庫存翻倍備戰供應鏈短缺｜GPT-5.6 Luna 降價 80%｜Reddit財報顯AI衝擊｜產業精選 07.31

Zuckerberg 預測個人 AI 代理五年內普及｜微軟 AI 投資兩樣情｜產業精選 07.30

2025台灣機器人與智慧自動化展揭示產業未來：NVIDIA引領 AI 浪潮，人形機器人、智慧製造與AI機器手臂成焦點

NVIDIA 下一盤好大的棋，用「Scale-Across」策略打造跨越地理限制的 AI

AI 機器人大腦更新，NVIDIA Blackwell 核心 Jetson Thor 將加速通用機器人時代到來

推薦閱讀

DeepSeek V4 Flash 正式版成績不俗且成本僅 Gemini 的 1/19，開放權重挑戰閉源 AI

FCC 擴大設備禁令海外先進機器人與電源逆變器入列

AI Agent 失控連環爆：OpenAI 與 Anthropic 模型雙雙突破隔離｜Thinking Machines 縮小模型受矚目｜產業精選 08.01

Anthropic安全評估出包三款Claude模型誤駭三家組織系統

QNAP AI NAS Edge AI 方案與自建 DGX Spark 地端 LLM 架構比較

近期熱門

告別隨意寫程式！Matt Pocock 推出 grill-me 技能，讓 AI 成為最嚴苛的架構審查官

GitHub 趨勢周報 Vol.25：去中心化通訊與AI代理工具

微軟發布 Windows 11 KB5101684 選擇性更新：檔案總管與搜尋速度提升，容量與穩定度全面解析

梁文鋒近 4 小時閉門會議紀要外洩：解密 DeepSeek 的 AGI 藍圖與融資暫停風波

Claude 對話意外被 Google 索引外流、微軟推 AI 資安平台｜產業精選 07.28

實戰指南：HDP Recovery Media Creator 打造 ISO 還原媒體，NAS 虛擬機沙盒完成 0 錯誤演練

實戰指南：Tailscale + QNAP 打造免網管跨國協作圈與檔案分享

Anthropic 砍掉 Claude Code 八成系統提示詞：Claude 5 世代的 Context Engineering 新規則

FCC 擴大設備禁令海外先進機器人與電源逆變器入列

Zuckerberg 預測個人 AI 代理五年內普及｜微軟 AI 投資兩樣情｜產業精選 07.30

關於 CyberQ 賽博客

Quorum 與 Quantum-safe

Query 與 Quotient

Quest與 Quantum Leap

中國 AI DeepSeek V3.1 模型升級，強調本土晶片最佳化與效能提升

RELATED POSTS

模型進化與核心技術改善

API 更新與市場策略調整

LLM 模型的參數量與系統需求資源概要

2025台灣機器人與智慧自動化展揭示產業未來：NVIDIA引領 AI 浪潮，人形機器人、智慧製造與AI機器手臂成焦點

相關文章

推薦閱讀

近期熱門

關於 CyberQ 賽博客

Quorum 與 Quantum-safe

Query 與 Quotient

Quest與 Quantum Leap