CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • 首頁
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • AI 代理
  • 龍蝦
  • AI 應用實戰
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊
聯繫我們
  • 首頁
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • AI 代理
  • 龍蝦
  • AI 應用實戰
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊
沒有結果
觀看所有搜尋結果
CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • 首頁
  • 新聞
  • AI 代理
  • 龍蝦
  • AI 應用實戰
  • 資安
  • Docker
  • 進階應用
  • 網通
  • NAS
  • 開箱測試
  • 教學
  • 展覽直擊
首頁 新聞 AI 人工智慧

中國 AI DeepSeek V3.1 模型升級,強調本土晶片最佳化與效能提升

Ashley Hsieh by Ashley Hsieh
2025 年 08 月 24 日 00:00
閱讀時間: 1 分鐘
A A
中國 AI DeepSeek V3.1 模型升級,強調本土晶片最佳化與效能提升
319
觀看數
分享到臉書分享到 X分享到Line分享到 Threads分享到 Linkedin

中國人工智慧新創公司 DeepSeek (深度求索),在相隔將近五個月後,再次大幅更新了他們的 V3 基礎模型,推出了 DeepSeek V3.1。這次升級的亮點,在於它具備了針對中國本土製造晶片的最佳化功能,同時處理速度也更快了。

RELATED POSTS

claude-usage 破解 Claude 用量盲盒,近期配額災情與生態觀察

受不了 Claude 的限制或當掉不能用的時候嗎? 將每月 100 美元預算重新分配給 Zed 與 OpenRouter 的最佳化策略

Claude Code 的 Vercel 擴充套件爆發隱私爭議,偷偷讀取所有專案的提示詞與 Bash 指令?

DeepSeek 對外指出,V3.1 模型採用了 UE8M0 FP8 精度格式。他們特別提到,這種格式是專門為「即將問世的下一代本土晶片」設計的。不過,該公司並沒有明確說明這項新功能具體支援哪些晶片型號或製造商。

模型進化與核心技術改善

這次是 DeepSeek 近期第三度進行模型更新。他們在今年三月先做了 V3 的早期強化,接著五月又發布了 R1 模型升級。DeepSeek-V3.1 對於分詞器和聊天模板(chat template) 做了大調整,與 DeepSeek-V3 有明顯區別。

新版本的核心特色是採用了全新的混合推論架構,讓模型能在同一框架下同時支援「思考」模式(Think)與「非思考」模式。相較於其 R1 推論模型,V3.1 Think 模式能更快給出答案。

透過後訓練的最佳化,新模型在使用工具和執行代理任務方面的表現有顯著提升,甚至在 Aider 多語言程式編碼基準測試中,得分還超越了 Anthropic 的 Claude 4 Opus。

DeepSeek 表示,經過思維鏈壓縮訓練後,V3.1-Think 在輸出 Token 數量減少 20% 到 50% 的情況下,各項任務的平均表現仍與該公司之前發表的 R1-0528 版本差不多;而且在多項搜尋代理測試中表現更大幅提升,超越了 R1-0528。

API 更新與市場策略調整

目前,DeepSeek 官方的 App 和網頁版模型都已同步升級到 V3.1。此外,DeepSeek API(應用程式介面)也同時升級,相關文件說明於此,且上下文記憶容量全面擴展到 128K。這代表模型現在能處理更多資訊,具備更強大的記憶能力。新版本同時也新增支援 Anthropic API 格式,以簡化開發者從其他平台轉換過來的流程。

DeepSeek 聲明 V3.1 模型使用的 UE8M0 FP8 精度格式是針對下一代中國本土晶片所設計。據了解,UE8M0 FP8 並非 NVIDIA 官方的 FP8 標準,而是其一種變體格式。目前支援 FP8 的主要是 NVIDIA H 系列和 B 系列,而中國本土晶片中也已有明確支援 FP8 的產品問世。

國外媒體引述分析指出,DeepSeek 對中國本土晶片相容性的重視,可能顯示隨著北京在美國華府出口限制下持續開發美國技術的替代品,DeepSeek 正將其 AI 模型與中國不斷發展的半導體生態系統能接續起來。

另一方面,DeepSeek 宣布將於 9 月 6 號起實行新的 API 定價方案,並取消夜間優惠。外界普遍認為,這代表著在服務能力擴大後,慢慢開始走向商業化。

我們實際上去測試 API ,可以發現他們的價格競爭力還是有的,預估近期各大 AI 公司的 API 價格策略會有一番調整以符合市場競爭。

標籤: AIDeepSeek
Share4Tweet3ShareShareShare1
上一篇

LLM 模型的參數量與系統需求資源概要

下一篇

2025台灣機器人與智慧自動化展揭示產業未來:NVIDIA引領 AI 浪潮,人形機器人、智慧製造與AI機器手臂成焦點

Ashley Hsieh

Ashley Hsieh

專案管理者與 UI/UX 設計、AI美術設計認證、淨零碳規劃管理師,在上市歐洲外商、生醫、金融、科技產業中淬煉,曾參與過多個跨平台專案,從需求分析、設計、使用者測試到專案交付流程都樂在其中。 私底下,我是一位「喜歡買東西但錢包容易抗議」的人,對科技、設計與藝術有熱情,正在努力平衡質感生活,學習和錢包一起成長的日常小練習者。

相關文章

claude-usage 破解 Claude 用量盲盒,近期配額災情與生態觀察
AI 人工智慧

claude-usage 破解 Claude 用量盲盒,近期配額災情與生態觀察

2026 年 4 月 10 日
受不了 Claude 的限制或當掉不能用的時候嗎? 將每月 100 美元預算重新分配給 Zed 與 OpenRouter 的最佳化策略
AI 人工智慧

受不了 Claude 的限制或當掉不能用的時候嗎? 將每月 100 美元預算重新分配給 Zed 與 OpenRouter 的最佳化策略

2026 年 4 月 10 日
Claude Code 的 Vercel 擴充套件爆發隱私爭議,偷偷讀取所有專案的提示詞與 Bash 指令?
新聞

Claude Code 的 Vercel 擴充套件爆發隱私爭議,偷偷讀取所有專案的提示詞與 Bash 指令?

2026 年 4 月 10 日
告別 Llama 時代?Meta 發布 Muse Spark 原生多模態模型聚焦個人超級 AI
AI 人工智慧

告別 Llama 時代?Meta 發布 Muse Spark 原生多模態模型聚焦個人超級 AI

2026 年 4 月 9 日
單卡訓練千億參數模型成為可能?解析 MegaTrain 記憶體架構
AI 人工智慧

單卡訓練千億參數模型成為可能?解析 MegaTrain 記憶體架構

2026 年 4 月 9 日
揮別盲目的背景連線:macOS 知名網路監控工具 Little Snitch 正式登陸 Linux
新聞

揮別盲目的背景連線:macOS 知名網路監控工具 Little Snitch 正式登陸 Linux

2026 年 4 月 9 日
下一篇
2025台灣機器人與智慧自動化展揭示產業未來:NVIDIA引領 AI 浪潮,人形機器人、智慧製造與AI機器手臂成焦點

2025台灣機器人與智慧自動化展揭示產業未來:NVIDIA引領 AI 浪潮,人形機器人、智慧製造與AI機器手臂成焦點

NVIDIA 下一盤好大的棋,用「Scale-Across」策略打造跨越地理限制的 AI

NVIDIA 下一盤好大的棋,用「Scale-Across」策略打造跨越地理限制的 AI

推薦閱讀

知名硬體監控工具 CPUID 網站遭駭:HWMonitor 與 CPU-Z 下載連結遭替換為惡意軟體

知名硬體監控工具 CPUID 網站遭駭:HWMonitor 與 CPU-Z 下載連結遭替換為惡意軟體

2026 年 4 月 10 日
claude-usage 破解 Claude 用量盲盒,近期配額災情與生態觀察

claude-usage 破解 Claude 用量盲盒,近期配額災情與生態觀察

2026 年 4 月 10 日
受不了 Claude 的限制或當掉不能用的時候嗎? 將每月 100 美元預算重新分配給 Zed 與 OpenRouter 的最佳化策略

受不了 Claude 的限制或當掉不能用的時候嗎? 將每月 100 美元預算重新分配給 Zed 與 OpenRouter 的最佳化策略

2026 年 4 月 10 日
Claude Code 的 Vercel 擴充套件爆發隱私爭議,偷偷讀取所有專案的提示詞與 Bash 指令?

Claude Code 的 Vercel 擴充套件爆發隱私爭議,偷偷讀取所有專案的提示詞與 Bash 指令?

2026 年 4 月 10 日
告別 Llama 時代?Meta 發布 Muse Spark 原生多模態模型聚焦個人超級 AI

告別 Llama 時代?Meta 發布 Muse Spark 原生多模態模型聚焦個人超級 AI

2026 年 4 月 9 日

近期熱門

  • 解放 Gemma 4 31B 潛力!破解版地端 AI 無審查模型 CRACK 解析與部署實作建議

    解放 Gemma 4 31B 潛力!破解版地端 AI 無審查模型 CRACK 解析與部署實作建議

    433 shares
    Share 173 Tweet 108
  • 榨乾 16GB VRAM!算力與應用完美分離的個人 AI 工作站建置教學

    514 shares
    Share 206 Tweet 129
  • 台灣動畫導演靠 AI 與五千元硬體神省救回 90TB ZFS 磁碟陣列

    268 shares
    Share 107 Tweet 67
  • 擺脫分頁焦慮!打造完全掌握資料自主權的個人知識庫,Wallabag + Obsidian + QNAP NAS 實作教學

    226 shares
    Share 90 Tweet 57
  • 利用 OpenCode 搭配 DGX Spark 與 QNAP NAS 打造企業級私有化 AI 開發大腦

    217 shares
    Share 87 Tweet 54
  • Mac Apple Silicon 專屬的本地 AI 選型與採購指南

    187 shares
    Share 75 Tweet 47
  • Docker 29.4.0 提升映像檔傳輸效能,並修正容器無法刪除的舊問題

    172 shares
    Share 69 Tweet 43
  • GitHub 趨勢週報2 Vol.9:邊緣運算升溫,把 LLM 塞進你的手機

    171 shares
    Share 68 Tweet 43
  • 揮別盲目的背景連線:macOS 知名網路監控工具 Little Snitch 正式登陸 Linux

    169 shares
    Share 68 Tweet 42
  • Anthropic 鐵腕封鎖 OpenClaw 等第三方平台接入!算力吃到飽神話破滅,AI 代理市場面臨大洗牌

    155 shares
    Share 62 Tweet 39

關於 CyberQ 賽博客

您的企業儲存、網路架構與資安科技好夥伴

專注於企業級網路與儲存環境建構、NAS 系統整合、資安解決方案與 AI 應用顧問服務,為您打造高可用、高安全、高效能的數位環境。

專業產業媒體 × 技術顧問團隊

我們關注新興科技趨勢,深入報導海內外產業動態,並結合多年實務經驗,提供量身打造的 IT 解決方案與精選內容。

我們提供的核心服務 : 

資安防護|網站開發與雲端服務|AI 導入與應用顧問|企業資訊環境建構|NAS 系統整合|數位內容產製|科技媒體|

CyberQ 致力於打造更智慧、更安全的數位未來。

新聞稿、採訪、授權、內容投訴、行銷合作、投稿刊登:[email protected]
廣告委刊、展覽會議、系統整合、資安顧問、業務提攜:[email protected]

Copyright ©2025 CyberQ.tw All Rights Reserved.

沒有結果
觀看所有搜尋結果
  • 首頁
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • AI 代理
  • 龍蝦
  • AI 應用實戰
  • 資安
    • ISO 合規
  • Docker
    • 虛擬化
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • 網通
    • 100GbE
    • 10GbE
  • NAS
  • 開箱測試
    • 選購指南
  • 教學
    • DR.Q 快問快答
  • 展覽直擊

© 2025 CyberQ NAS、資安、資訊科技、AI應用的日常 關於 CyberQ 賽博客 NAS 系統與電腦、手機一起的生活故事 多年的系統整合與資訊安全經驗,協助智慧家居、小型工作室、辦公室與機構,導入更便利、更安全的資訊環境與應用。