Google DeepMind 團隊宣布,專為深度推理設計的 Gemini 3 Deep Think 迎來核心升級。這款模型是為了協助科學家與工程師解決缺乏明確路徑或單一答案的複雜難題而開發。目前,該功能已開放給 Google AI Ultra 訂閱用戶,並首度透過 Gemini API 提供給特定研究機構與企業進行早期測試。
從理論研究到實務應用
在實際案例中,Rutgers University (羅格斯大學) 的數學家 Lisa Carbone 利用 Deep Think 審閱極具技術難度的數學論文,模型成功識別出一個連人類同儕審查都未曾察覺的邏輯缺陷。此外,在半導體材料研發領域, Duke University (杜克大學) 的 Wang Lab 也透過 Deep Think 最佳化了複雜晶體的生長配方,成功達成以往技術難以企及的精準目標。
不僅限於學術研究,Deep Think 在工程實務上也展現強大潛力。用戶只需提供簡單的草圖,模型即可分析圖形、建模並生成可供 3D 列印的檔案,將創意快速轉化為實體。
數學與程式競賽的頂尖表現
除了上述提到的功能外,Gemini 3 Deep Think 在多項嚴苛的基準測試中均取得突破性成績:

ARC-AGI-2:獲得 84.6% 的驚人高分,再次驗證其通用人工智慧的推理能力。
Codeforces:在競爭激烈的程式設計平台上,Elo 分數達到 3455 的頂尖水準。
國際奧林匹亞:在 2025 年國際數學奧林匹亞(IMO)達到金牌級表現,並在物理(IPhO)與化學(IChO)的筆試部分同樣斬獲金牌級成績。

CyberQ 認為,這次的升級進步幅度很顯著,AI 的資訊處理能力更往上,已經是能與人類頂尖科學家並肩實作的研究夥伴了。寫程式也是我們的好幫手,這在兩年前是根本沒想到會進步這麼快的情境。
演算法領域的驚人跨越
根據最新的技術評測,當前頂尖模型如 Claude Opus 4.6 的 Elo 分數大約落在 2352 左右。然而,Gemini 3 Deep Think 在這項關鍵指標上展現了壓倒性的優勢,大幅領先超過 1,000 分。
CyberQ 觀察,在演算法演進的進程中,如此巨大的分數差,並非僅是小幅度的最佳化,而是一個相當有進展的技術提升。Google 在深度推理技術上已拉開與其它 AI 模型的差距,未來 AI 在解決人類未知的科學難題上,將扮演比預期更關鍵的角色。其他模型的近期發展與推出新版,勢必在深度推理上將有更多的聚焦。
回到之前 Anthrophic 執行長說到的,Anthropic CEO 警告:人類社會尚未成熟到足以駕馭超知能,我們的未來準備好逐步迎接這樣的狀態了嗎 ?
首圖由 Nano Banana AI 生成







