Google DeepMind 正式宣布推出全新一代影像生成與編輯模型 Nano Banana Pro,這款模型建立在 Gemini 3 Pro 的架構之上,具備更強大的推理能力與真實世界知識。
相較於前一代主打快速趣味編輯的 Nano Banana,新版本專注於解決專業創作需求,提供精準的文字渲染、極高的畫面一致性以及細膩的攝影控制選項。對於設計師、行銷人員以及內容創作者而言,這意味著能將腦中的創意構想轉化為更高品質的視覺作品。
具備邏輯推理能力的視覺化工具
Nano Banana Pro 的核心優勢在於整合了 Gemini 3 的高階推理能力。這讓它不僅僅是一個繪圖工具,更是一個能理解複雜語境的創作夥伴。該模型能夠處理抽象的概念,例如將手寫筆記轉化為精美的流程圖,或是根據輸入的數據製作專業資訊圖表。
Google 強調這款模型能夠結合 Google Search 的知識庫,獲取即時資訊並轉化為視覺內容。例如使用者可以要求製作一張包含即時天氣資訊的普普藝術風格圖表,或是針對特定植物生成包含產地與照護須知的教學圖卡。這種將「資訊」精準轉譯為「圖像」的能力,大幅提升了 AI 在教育與商業簡報領域的實用性。
突破文字渲染技術瓶頸 支援多語言輸出
過去 AI 生成圖像最常遇到的瓶頸之一就是文字呈現,往往會出現亂碼或拼寫錯誤。Nano Banana Pro 在這方面取得了重大突破,能夠在圖像中精準生成清晰可讀的文字,無論是簡短的標語還是長篇段落皆能處理。

範例一、貓頭鷹水氧機的產品說明書,主要目的是測試圖片中的繁體中文是否正確無誤以及特殊排版能力,CyberQ 有指定產品外觀及說明書要摺頁式,但 Gemini 3 認為需要更清楚的提詞,因此主動提供了提詞,再次出入後即產生此說明書。

範例二、先產生 logo 後,做成促銷海報放到路邊的海報架中
這項功能對於製作產品 Mockup、海報或標誌設計尤為重要。該模型支援多種字體與材質的文字設計,並且具備多語言處理能力。在官方展示的案例中,模型成功將飲料罐上的英文說明翻譯並渲染為韓文,同時保留了原本的設計風格與材質反光細節。這項功能將協助公司更有效率地進行跨國行銷素材的在地化製作。

範例三、將 logo 做成手機殼,可以很明顯發現出錯了,logo的下半部在另一個手機殼上
專業級的畫面一致性與攝影控制
針對連貫性創作的需求,Nano Banana Pro 支援融合多達 14 張參考圖像,並能同時維持最多 5 個角色的人物特徵一致性。這解決了過去生成連環漫畫或分鏡腳本時,角色長相忽大忽小的痛點。創作者現在可以更輕鬆地將草圖轉化為高擬真產品圖,或是將不同素材合成為一張光影自然、風格統一的電影級畫面。

範例四、先產生一個角色,測試在四格漫畫中,角色特徵是否會改變
此外新模型賦予使用者類似專業攝影師的控制權。使用者可以針對圖像進行局部編輯,調整虛擬相機的角度、改變對焦點(景深效果),甚至直接改變場景的光源與時間,例如將白天的場景無縫轉換為夜晚,或是創造強烈的明暗對比效果。這款模型最高支援 4K 解析度的輸出,滿足從社群媒體到印刷品的各式需求。

範例五、將照片場景由白天改成夜晚,不知為何自動將天空的天線修掉了

範例六、產生一張花瓶掉落地面的照片,看水痕、玻璃碎片、四散的花朵是否有不自然之處
全面導入 Google 生態系與安全機制
目前 Nano Banana Pro 已開始逐步導入 Google 旗下的各項產品服務。一般使用者可透過 Gemini App 中的「思考(Thinking)」模式體驗,免費版用戶享有有限額度,Google AI Plus、Pro 與 Ultra 訂閱用戶則擁有更高額度。針對開發者與公司用戶,該模型已在 Google AI Studio 與 Vertex AI 上架,廣告主也能在 Google Ads 中運用此技術生成行銷素材。
為了確保 AI 內容的透明度,所有由 Nano Banana Pro 生成的圖像都會嵌入 SynthID 數位浮水印,這是一種人眼無法察覺但可被軟體偵測的技術,用以標示內容由 AI 生成。
CyberQ 的實測綜合分析
繁體中文渲染能力的顯著突破:過去使用 AI 生成圖片時,最令創作者頭痛的莫過於文字處理。舊世代模型在處理英文時偶有拼寫錯誤,而在處理結構複雜的繁體中文時,幾乎只能生成無法辨識的亂碼或似是而非的類漢字圖形。在本次實測中,Nano Banana Pro 展現了驚人的進步。
無論是要求在霓虹燈招牌上生成特定標語,或是在促銷海報上嵌入「Black Friday」等字樣,模型都能精準地還原字形結構與筆畫細節。這意味著行銷人員在製作包含文字的視覺素材時,後製修圖的時間將大幅縮短,模型已具備直接產出可用素材的能力。
影像光影與物理邏輯的成熟:在進行多格分鏡(小女孩與狗)的測試中,我們發現該模型對於「一致性」的掌握度極高。角色的人物特徵、服裝細節以及光影在不同場景下的變化,都展現了極佳的連貫性,相較於其他模型,Nano Banana Pro 展現了更為穩定的運算邏輯。
空間理解與邊界控制的盲點:然而在進行 iPhone 手機殼的產品 Mockup 測試時,我們觸及了目前模型的極限。當指令要求將 Logo 放置於手機殼上並以線條填滿留白時,模型未能正確識別「手機殼」與「背景」或「另一支手機」之間的物理邊界。
測試結果顯示,Logo 的圖案發生了跨越物體的溢出現象,直接延伸到了旁邊的物件上。這顯示模型雖然在平面繪圖與文字渲染上表現優異,但在處理這種需要精確「物件分離(Object Segmentation)」與 3D 空間曲面貼圖的任務時,仍傾向於將畫面視為一個平面畫布,而非獨立的立體物件。
不過,如果需要比較精細調整和客戶討論的工業設計或產品合成的更多需求,目前仍需要人工介入調整。
總結 瑕不掩瑜的商業應用利器
CyberQ 觀察,以現階段測試和社群的反應,總體來說 Nano Banana Pro 的表現令人印象深刻。它解決了 AI 繪圖長期以來在文字渲染上的痛點,並在影像質感與邏輯性上樹立了新的標竿。雖然在處理複雜的物件邊界與產品貼圖時仍偶有失誤,但這並不影響其作為強大輔助工具的地位。
CyberQ 認為,對於平面設計、社群行銷與內容創作者而言,只要避開極度複雜的 3D 結構合成,Nano Banana Pro 無疑是目前市面上最強悍的 AI 影像生成選擇。
本文題圖 Google Gemini AI / Nano Banana Pro 生成








