CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
  • 新聞
  • 基礎教學
    • NAS 基礎設定
  • Docker / 容器
    • 虛擬化
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
聯繫我們
  • Home
  • 新聞
  • 基礎教學
    • NAS 基礎設定
  • Docker / 容器
    • 虛擬化
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
沒有結果
觀看所有搜尋結果
CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
  • 新聞
  • 基礎教學
  • Docker / 容器
  • 資安專區
  • AI 應用實戰
  • 進階應用
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
首頁 進階應用 AI 應用實戰

Gemini AI 影像編輯功能大升級:外觀一致性吸納了大量開發者與用戶

Ashley Hsieh by Ashley Hsieh
2025 年 9 月 4 日
Reading Time: 2 mins read
A A
Gemini AI 影像編輯功能大升級:外觀一致性吸納了大量開發者與用戶
6
分享數
127
觀看數
分享到臉書分享到 X分享到Line分享到 Threads

Google DeepMind 近期發布了 Gemini 應用程式中一項重大的功能升級。之前我們有做過這篇報導 :

RELATED POSTS

SEMICON Taiwan 2025 揭示 AI 與先進封裝雙重引擎 – 台灣半導體產業持續進化

史上最薄 iPhone AIR 、iPhone 17 發表,搭載新 AI 功能,蘋果新品 AirPods Pro3、Apple Watch 11 亦高度整合 AI 功能

高記憶體 AI 算力平替版,中國廠商魔改 NVIDIA RTX 5090,記憶體擴增四倍至 128GB

Gemini 2.5 Flash Image 突破當前 AI 圖片生成與編輯天花板

繼續深入探究這次更新的重點,是解決長期以來 AI 圖片編輯在修改人物或寵物照片時,普遍存在的「樣貌失真」問題。透過更先進的上下文理解與生成能力,新模型讓使用者能以自然語言進行精細、多輪的圖片編輯,同時確保主體(如人臉、寵物特徵)的高度一致性,吸引了全球大量的開發者與用戶持續在 Google Gemini AI 平台和 Imagen4 平台上使用。

很多開發者只要付費使用 Gemini 圖像生成 Api ,就可以做出很好用的衣服試穿網站、AI 換臉、AI 專業肖像照合成等多種網站或 App 服務,基於 Google Gemini Api 的產業端圖片應用也正蓬勃發展。

核心技術突破:維持「外觀一致性」

過去,使用者在利用 AI 工具為照片中的人物更換服裝或背景時,常會發現主角的臉部特徵或神韻也跟著產生微妙、甚至明顯的變化,生成結果「相似,但又不完全是同一個人」。Google 這次更新的關鍵技術突破,便在於維持樣貌的一致性 (Appearance Consistency)。

使用者現在可以透過 Gemini 執行以下複雜的編輯任務,而無需擔心主角失真,還可以將特定人物或寵物的照片,無縫置入全新的場景,例如把一張在客廳拍攝的寵物照,背景更換為「正在外太空漫步」;或為人物「換上一套未來感的盔甲」、「將直髮換成捲髮」等。模型更支援將不同照片中的人物或寵物提取出來,能將多張不同照片自然地融合到同一張新的圖片中,創造出全新的合照。使用者還能上傳一張參考圖片,將其獨特的藝術風格(例如油畫的筆觸、特定電影的色調)應用到自己想要編輯的照片上。

操作流程革新:多輪對話式編輯

除了生成品質的提升,Gemini 在人機互動流程上也進行了革新,引入了多輪對話式編輯 (Multi-turn, Conversational Editing) 的概念。這徹底改變了傳統圖片編輯軟體需要精通複雜工具欄的模式,也超越了多數 AI 工具「一次性 Prompt 指令」的限制,其工作流程更接近與一位專業設計師的溝通,使用者上傳圖片後,可以透過下達語言指令對圖面進行局部編輯,例如「把這件藍色外套拿掉」。

在 Gemini 產生初步結果後,使用者可以繼續下達一系列的追問指令來進行微調,例如「幫他穿上一件黑色皮夾克」、「讓夾克看起來舊一點,多點磨損痕跡」、「背景加上下雨的街景」,模型會理解上下文,持續在同一張圖片上進行疊代修改。這種對話式的流程,極大地降低了專業影像編輯的門檻,讓普通使用者也能透過簡單的口語化指令,完成精細的創意修改。

AI 倫理與透明度實踐

面對生成式 AI 內容可能被濫用的疑慮,Google 在此次更新中也強調了其在責任與透明度上的實踐。所有透過 Gemini 應用程式建立或進行大幅度編輯的圖片,都會被嵌入兩種標記:可見浮水印(在圖片上直接加入標示,表明其為 AI 生成)、SynthID 數位浮水印(一種嵌入在圖片像素中,肉眼無法察覺的數位浮水印,能更穩定地標示其來源,即便經過裁切或壓縮等修改,仍有機會被偵測)。

CyberQ 觀點 : 精準編輯將帶來業界的改變

Gemini 此次的影像編輯功能升級,不僅僅是單點的技術展示,它更揭示了未來 AI 工具發展已經從「生成」到「精準編輯」,AI 的能力正從天馬行空的「無中生有」,進化到能理解並精準修改現有內容的細節,這使其在專業工作流程中的實用性大幅提升,強大的 AI 功能正被直接整合進使用者熟悉的應用程式與對話介面中,透過自然語言取代複雜的專業操作。

隨著這類技術的成熟,它將對內容創作、廣告行銷、個人娛樂等領域將產生深遠的影響,傳統影像處理軟體的工作流程與市場格局,也可能因此迎來新的變革。

本文題圖採用 Google Gemini AI 生成

Qwen Image AI 圖像模型效果佳,本地端 AI 算圖新選擇
標籤: AIAI產圖Gemini 2.5Google
Share2Tweet2ShareShare
上一篇

Salesloft Drift 整合漏洞災情擴大,多家企業的Salesforce 資料外流,科技大廠說明曝險範圍

下一篇

韓國專屬產業用 AI 觀察,特化版 AI 扮演製造加速器角色

Ashley Hsieh

Ashley Hsieh

具備 UI/UX 、專案管理、科技產業經驗。 興趣是喜歡買東西,但是沒有錢。

相關文章文章

SEMICON Taiwan 2025 揭示 AI 與先進封裝雙重引擎 – 台灣半導體產業持續進化
展覽直擊

SEMICON Taiwan 2025 揭示 AI 與先進封裝雙重引擎 – 台灣半導體產業持續進化

2025 年 9 月 11 日
史上最薄 iPhone AIR 、iPhone 17 發表,搭載新 AI 功能,蘋果新品 AirPods Pro3、Apple Watch 11 亦高度整合 AI 功能
新聞

史上最薄 iPhone AIR 、iPhone 17 發表,搭載新 AI 功能,蘋果新品 AirPods Pro3、Apple Watch 11 亦高度整合 AI 功能

2025 年 9 月 10 日
高記憶體 AI 算力平替版,中國廠商魔改 NVIDIA RTX 5090,記憶體擴增四倍至 128GB
新聞

高記憶體 AI 算力平替版,中國廠商魔改 NVIDIA RTX 5090,記憶體擴增四倍至 128GB

2025 年 9 月 9 日
Gemini AI 全面進駐你家,Google Nest 新品齊發聚焦 AI 再下一城
新聞

Gemini AI 全面進駐你家,Google Nest 新品齊發聚焦 AI 再下一城

2025 年 9 月 8 日
特斯拉提出史上最鉅額薪酬方案,馬斯克有望成為首位一兆美元富豪,AI5晶片將由台積電代工
新聞

特斯拉提出史上最鉅額薪酬方案,馬斯克有望成為首位一兆美元富豪,AI5晶片將由台積電代工

2025 年 9 月 8 日
OpenAI 繼續燒錢,預估至 2029 年業務支出將高達 1150 億美元
新聞

OpenAI 繼續燒錢,預估至 2029 年業務支出將高達 1150 億美元

2025 年 9 月 8 日
下一篇
韓國專屬產業用 AI 觀察,特化版 AI 扮演製造加速器角色

韓國專屬產業用 AI 觀察,特化版 AI 扮演製造加速器角色

你們家的 AI 伺服器在網路上裸奔嗎 ? Cisco 揭露上千台 Ollama LLM 設備曝險門戶洞開

你們家的 AI 伺服器在網路上裸奔嗎 ? Cisco 揭露上千台 Ollama LLM 設備曝險門戶洞開

推薦閱讀

美國 AI 經濟版圖呈現 AI 落差正擴大中,職場階層也深受影響,中低階工作恐出現部分斷層

美國 AI 經濟版圖呈現 AI 落差正擴大中,職場階層也深受影響,中低階工作恐出現部分斷層

2025 年 9 月 2 日
QNAP HA 高可用 NAS 成功跨入企業儲存聖杯 – QNAP Tech Summit 2025

QNAP HA 高可用 NAS 成功跨入企業儲存聖杯 – QNAP Tech Summit 2025

2025 年 5 月 26 日
在 QNAP NAS 用 Docker架設個人網站服務實作

在 QNAP NAS 用 Docker架設個人網站服務實作

2025 年 7 月 19 日

熱門文章

  • 在你的電腦上跑本地端 ChatGPT,OpenAI 釋出開源模型 gpt-oss

    在你的電腦上跑本地端 ChatGPT,OpenAI 釋出開源模型 gpt-oss

    31 shares
    Share 12 Tweet 8
  • 史上最薄 iPhone AIR 、iPhone 17 發表,搭載新 AI 功能,蘋果新品 AirPods Pro3、Apple Watch 11 亦高度整合 AI 功能

    26 shares
    Share 10 Tweet 7
  • Proxmox VE 9.0 正式發布,帶來多項重大更新與功能躍進

    18 shares
    Share 7 Tweet 5
  • 主要 AI 模型 API 價格比較 (2025年8月版)

    15 shares
    Share 6 Tweet 4
  • 手機廣告終結者:AdGuard Home x QNAP NAS 守護辦公室與居家網路實戰

    13 shares
    Share 5 Tweet 3

關於 CyberQ 賽博客

您的企業儲存、網路架構、資安與資訊科技專家|企業網路、NAS、資安、AI應用的日常

企業核心儲存與網路架構|資安解決方案|NAS 系統整合|資訊科技顧問|AI 應用服務

我們專精於上述服務,並持續精進相關技術,並提供優質內容

CyberQ 具備多年實務經驗,致力打造更便利、更安全、更耐用的高可用性數位資訊環境。

Copyright ©2025 CyberQ.tw All Rights Reserved.

沒有結果
觀看所有搜尋結果
  • Home
  • 新聞
  • 基礎教學
    • NAS 基礎設定
  • Docker / 容器
    • 虛擬化
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊

© 2025 CyberQ NAS、資安、資訊科技、AI應用的日常 關於 CyberQ 賽博客NAS 系統與電腦、手機一起的生活故事多年的系統整合與資訊安全經驗,協助智慧家居、小型工作室、辦公室與機構,導入更便利、更安全的資訊環境與應用。