Google 於昨(18)日正式發佈了備受期待的 Gemini 3 模型家族。如果說 2024 年是「多模態」的元年,那麼 2025 年末的 Gemini 3 則正式宣告了 AI 進入「代理人(Agentic)」與「動態介面(Generative UI)」的實戰時代。
面對 OpenAI GPT-5.1 與 Anthropic Sonnet 4.5 的強勢夾擊,Google 這次不僅僅是提升了參數與推論能力,更試圖透過 Google Antigravity 平台與全新的 Dynamic View(動態視圖),徹底改變我們與 AI 的互動形式——從單純的「對話」轉向「共同協作」。
Google 官方也更新了 Gemini API 的技術說明文件 : Gemini 3 開發人員指南,強調這次的模型更新是 Google 迄今最強大的模型系列,以最先進的推理技術為基礎建構而成。這項產品旨在協助您掌握代理式工作流程、自主編碼和複雜的多模態工作,將任何想法付諸實現。

目前關於視覺版面配置與動態檢視尚未完整全部上線,Google 表示會從今日起逐步推出。目前實測有些功能,還是只有美國的 Google AI Pro 和 Ultra 訂閱用戶可以使用。以下是我們這次關於 Gemini 3 的綜合解析:
從 Chatbot 進化為 Thought Partner
根據 Google 執行長 Sundar Pichai 的說法,Gemini 3 是目前「全球最強大的多模態理解模型」。
這次更新的重點除了拓展讀懂文字或圖片的功能牆外,最重要的是強調「深度推理(Deep Reasoning)」與「主動執行」。
關鍵技術突破
Gemini 3 Deepthink (深度思考模式): 針對複雜的邏輯與數理問題,Google 推出了類似 OpenAI o1/o3 系列的強化推理版本。它能進行多步驟的思維鏈(Chain of Thought)處理,在解答前先「思考」。
同時,新的 AI 模型也成為 LMArena 新王者,在權威的 LMArena 排行榜上,Gemini 3 Pro 以 1501 Elo 的積分獲得新的冠軍,超越馬斯克他們剛發表的 Grok 4.1。
Gemini 3 甚至還通過「人類最後的考試」,在被稱為 Humanity’s Last Exam 的超高難度基準測試中,Gemini 3 取得了 37.5% 的分數,並在 GPQA Diamond 測試中達到 91.9%,顯示其具備博士級別的推理能力。

革命性功能 Generative UI (生成式介面)
這可能是 Gemini 3 最讓市場驚豔的功能,Google 試圖打破「對話框」的限制,這種新的設計是還不錯的。
Visual Layout (視覺化佈局): 當你要求規劃「羅馬的三天行程」時,Gemini 3 不再只是吐出一長串文字,而是會即時生成一個類似旅遊雜誌的排版,包含圖片、互動模組和地圖。
Dynamic View (動態視圖): 這是真正的殺手級應用。如果你問「解釋梵谷畫作的背景」,AI 會即時編寫程式碼,生成一個可互動的網頁介面,讓你可以點擊、滑動來探索資訊。這意味著 AI 在回應你的當下,實際上是在「寫一個 App 給你用」。
開發者生態:Google Antigravity 與 Vibe Coding
對於工程師與開發者來說,Gemini 3 的發布伴隨著一個全新平台,Google Antigravity。
Agentic Coding (代理人編碼): Gemini 3 被官方稱為最強的「Vibe Coding」模型(指能精準捕捉開發者意圖與風格的編碼體驗)。它不僅是寫 Code,還能理解整個專案的上下文(Context)。
工具整合: Google 宣布 Gemini 3 已深度整合進 Cursor、GitHub、JetBrains 等主流開發工具。社群指出,在 Cursor 中使用 Gemini 3 Pro 進行前端開發時,其理解 UI 設計稿並轉化為程式碼的能力有顯著提升。
Gemini 3,它不再只是「說」,而是直接「畫」給你看
CyberQ 實測 Gemini 3,如果你在美國的用戶可以一早就可以測試了,其他國家用戶則看 Google 分區開放的時間。我們直接用一個考驗資訊整合的場景來挑戰:複雜旅遊規劃。
測試用提詞指令 (Prompt):
「幫我規劃一個京都 5 天 4 夜的攝影師專屬行程。避開清水寺等一級戰區,專注於『清晨的光影』、『無人的古老街道』與『長滿青苔的隱藏寺廟』。請給我一個可以視覺化調整的行程表。」
1、傳統體驗 vs. Gemini 3 體驗
以往,AI 會產生約 2,000 字的條列式文字,我們得自己一邊讀、一邊去 Google Maps 標記。但這次,Gemini 3 的反應完全不同:
回應延遲: 比以往更快速。
介面變化: 聊天視窗展開後,文字只佔了左側 20%,右側出現了一個全彩的、互動式的旅遊規劃。
2、Dynamic View 的實際運作
這個自動生成的儀表板包含了三個動態模組:
模組 A:時光地圖 (Timeline Map) 介面直接顯示了一張京都地圖,上面用不同顏色的線條畫出了五天的路線。最驚人的是,地圖下方有一個「時間軸滑桿」。
互動實測: 將ˊ間早上 6:00 拉到 8:00,地圖上的標記點(例如:蓮華寺)會根據當時的預估光線角度和人潮擁擠度變色。AI 標註:「建議 06:30 抵達,此時陽光會穿過楓葉投射在青苔上。」
模組 B:視覺藝廊 (Visual Gallery) 這不是隨機抓圖。Gemini 3 抓取了 Instagram 和 Google Maps 上的高畫質攝影作品,排成了一個類似 Pinterest 的瀑布流。
互動實測: 看到一張「瑠璃光院」的照片覺得太人工,直接點擊照片上的「不感興趣」。整個行程表瞬間重組,AI 立刻補上了風格更原始的「直指庵」,並自動重新計算交通時間。
模組 C:預算與物流計算機 右下角有一個小視窗顯示預估費用。
互動實測: 我在對話框輸入:「我想把第三天的午餐升級成米其林二星的懷石料理。」
結果: 介面沒有重整,而是像 Excel 公式連動一樣,預算欄位數字直接跳動,同時地圖上多出了一個餐廳標點,行程順序自動微調以配合餐廳訂位時間。
3、這不是 Chatbot,這是 App 生成器
在整個過程中,幾乎感覺不到是在跟一個「聊天機器人」對話,而是在使用一個專門為我們當下需求瞬間寫出來的簡易旅遊 App。
過去我們常說 AI 是 Copilot(副駕駛),但在 Gemini 3 的 Dynamic View 中,它更像是一個熟練的導遊,直接把地圖攤開在桌上,拿著筆畫給你看,而且你隨時可以把他的筆搶過來自己改。這就是 Google 這次最強的護城河——它利用了自家強大的圖資與搜尋生態,築起了一道純文字模型難以跨越的高牆。
社群與市場評論:真實的聲音
在 Reddit (r/LocalLLaMA, r/Singularity) 與 X (Twitter) 上,針對 Gemini 3 的討論近期很熱烈。
正面評價:
「動態介面是 Game Changer。」 許多科技評論家認為,Dynamic View 解決了 LLM 輸出資訊過於線性、難以消化的痛點。
「推理能力終於追上了。」 對於 Deepthink 版本,數學與科學領域的用戶表示其邏輯跳躍(Hallucination)的情況大幅減少。
「Antigravity 的代理能力很強。」 開發者對於 AI 能自主完成多步驟任務(如:搜尋資料 -> 整理表格 -> 寫成報告 -> 發送郵件)印象深刻。
保留與批評:
「速度與成本的權衡。」 雖然 Gemini 3 Pro 強大,但 Deepthink 模式的推論速度較慢,且 API 成本不低,社群仍在觀望 Flash 版本的表現。
「這真的是 AGI 嗎?」 儘管 Google 宣稱這是邁向 AGI 的一大步,但部分學者認為這仍是 Transformer 架構的最佳化,而非本質上的智慧覺醒。
Google 的 AI 策略反攻
儘管 AI Mode 的 Gemini 3 功能將在美國先上線,其他地區尚未公布開放時程,但CyberQ 認為 Gemini 3 的意義在於 Google 終於找到了將「搜尋霸主地位」與「生成式 AI」完美結合的甜蜜點,也就是這次推出的動態介面。
過去兩年,我們擔心 AI 會取代搜尋引擎,現在,Google 透過 Gemini 3 告訴我們,未來的搜尋引擎會變成直接生成答案的介面,而不僅僅是連結或文字。這對於內容創作者和網站經營者來說,將是新一輪的流量挑戰,但對於使用者體驗而言,無疑是巨大的升級。
下一步觀察重點:
企業採用率: Google Cloud 已經同步上架 Gemini 3,企業是否會從 Azure/OpenAI 陣營轉移?
消費端落地: Android 手機何時能全面整合這些動態 UI 功能?
懶人包:關於 Gemini 3,讀者最想知道的 4 件事
為了節省大家爬文的時間,我們整理了目前社群最關心的幾個問題:
Q1:一般用戶現在可以用到了嗎?需要付費嗎?
A: 可以,Google 這次採取全面開放策略。
免費版: 所有 Google 用戶現在登入 gemini.google.com 即可使用 Gemini 3 Flash(速度快、有動態介面功能,但推理深度較淺)。
付費版 (Gemini Advanced): 若要使用最強的 Gemini 3 Pro (Deepthink) 以及完整的 200 萬 token 上下文,需訂閱 Google One AI 進階版(台灣定價維持月費 $650 NTD)。
Q2:Dynamic View (動態介面) 支援繁體中文嗎?
A: 支援度極高。在我們的實測中,無論是生成旅遊行程、財務報表還是簡單的網頁,Gemini 3 都能完美顯示繁體中文內容,且排版符合台灣閱讀習慣,不會出現簡體字或奇怪的字體渲染。
Q3:它跟 iOS 的整合度如何?
A: 目前 Android 用戶享有系統層級的優先整合(可取代 Google Assistant)。iOS 用戶目前仍需透過 Google App 或獨立的 Gemini App 使用,雖然功能完整,但無法像在 Pixel 手機上那樣「一鍵喚醒」來操作其他 App。
Q4:開發者說的 Antigravity 平台去哪裡用?
A: 這是針對企業與開發者的功能。目前已在 Google Cloud Console 與 Google AI Studio 上線。如果你是使用 Cursor 或 VS Code 的工程師,需等待相關外掛更新 API Key 設定(預計本週內陸續支援)。
Google 官方文件 :
本文題圖由 ComfyUI 搭配本地端 AI 模型生成










