CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • Docker / 容器
    • 虛擬化
  • 基礎教學
    • NAS 基礎設定
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
聯繫我們
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • Docker / 容器
    • 虛擬化
  • 基礎教學
    • NAS 基礎設定
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
沒有結果
觀看所有搜尋結果
CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
  • 新聞
  • 資安專區
  • AI 應用實戰
  • Docker / 容器
  • 基礎教學
  • 進階應用
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
首頁 新聞 AI 人工智慧

Gemini AI 影像編輯功能大升級:外觀一致性吸納了大量開發者與用戶

Ashley Hsieh by Ashley Hsieh
2025 年 9 月 4 日
閱讀時間: 2 分鐘
A A
Gemini AI 影像編輯功能大升級:外觀一致性吸納了大量開發者與用戶
170
觀看數
分享到臉書分享到 X分享到Line分享到 Threads分享到 Linkedin

Google DeepMind 近期發布了 Gemini 應用程式中一項重大的功能升級。之前我們有做過這篇報導 :

RELATED POSTS

微軟 Copilot Studio 擴充套件正式版 VS Code 支援 AI 代理開發與 Git 協作

Grok 祭出地理封鎖與付費牆防堵 xAI 平台上的深偽影像

4 秒出圖!FLUX.2 klein 正式登場,實測 BFL 新一代開源生圖模型,支援 NVFP4 與 4B 商用版

Gemini 2.5 Flash Image 突破當前 AI 圖片生成與編輯天花板

繼續深入探究這次更新的重點,是解決長期以來 AI 圖片編輯在修改人物或寵物照片時,普遍存在的「樣貌失真」問題。透過更先進的上下文理解與生成能力,新模型讓使用者能以自然語言進行精細、多輪的圖片編輯,同時確保主體(如人臉、寵物特徵)的高度一致性,吸引了全球大量的開發者與用戶持續在 Google Gemini AI 平台和 Imagen4 平台上使用。

很多開發者只要付費使用 Gemini 圖像生成 Api ,就可以做出很好用的衣服試穿網站、AI 換臉、AI 專業肖像照合成等多種網站或 App 服務,基於 Google Gemini Api 的產業端圖片應用也正蓬勃發展。

核心技術突破:維持「外觀一致性」

過去,使用者在利用 AI 工具為照片中的人物更換服裝或背景時,常會發現主角的臉部特徵或神韻也跟著產生微妙、甚至明顯的變化,生成結果「相似,但又不完全是同一個人」。Google 這次更新的關鍵技術突破,便在於維持樣貌的一致性 (Appearance Consistency)。

使用者現在可以透過 Gemini 執行以下複雜的編輯任務,而無需擔心主角失真,還可以將特定人物或寵物的照片,無縫置入全新的場景,例如把一張在客廳拍攝的寵物照,背景更換為「正在外太空漫步」;或為人物「換上一套未來感的盔甲」、「將直髮換成捲髮」等。模型更支援將不同照片中的人物或寵物提取出來,能將多張不同照片自然地融合到同一張新的圖片中,創造出全新的合照。使用者還能上傳一張參考圖片,將其獨特的藝術風格(例如油畫的筆觸、特定電影的色調)應用到自己想要編輯的照片上。

操作流程革新:多輪對話式編輯

除了生成品質的提升,Gemini 在人機互動流程上也進行了革新,引入了多輪對話式編輯 (Multi-turn, Conversational Editing) 的概念。這徹底改變了傳統圖片編輯軟體需要精通複雜工具欄的模式,也超越了多數 AI 工具「一次性 Prompt 指令」的限制,其工作流程更接近與一位專業設計師的溝通,使用者上傳圖片後,可以透過下達語言指令對圖面進行局部編輯,例如「把這件藍色外套拿掉」。

在 Gemini 產生初步結果後,使用者可以繼續下達一系列的追問指令來進行微調,例如「幫他穿上一件黑色皮夾克」、「讓夾克看起來舊一點,多點磨損痕跡」、「背景加上下雨的街景」,模型會理解上下文,持續在同一張圖片上進行疊代修改。這種對話式的流程,極大地降低了專業影像編輯的門檻,讓普通使用者也能透過簡單的口語化指令,完成精細的創意修改。

AI 倫理與透明度實踐

面對生成式 AI 內容可能被濫用的疑慮,Google 在此次更新中也強調了其在責任與透明度上的實踐。所有透過 Gemini 應用程式建立或進行大幅度編輯的圖片,都會被嵌入兩種標記:可見浮水印(在圖片上直接加入標示,表明其為 AI 生成)、SynthID 數位浮水印(一種嵌入在圖片像素中,肉眼無法察覺的數位浮水印,能更穩定地標示其來源,即便經過裁切或壓縮等修改,仍有機會被偵測)。

CyberQ 觀點 : 精準編輯將帶來業界的改變

Gemini 此次的影像編輯功能升級,不僅僅是單點的技術展示,它更揭示了未來 AI 工具發展已經從「生成」到「精準編輯」,AI 的能力正從天馬行空的「無中生有」,進化到能理解並精準修改現有內容的細節,這使其在專業工作流程中的實用性大幅提升,強大的 AI 功能正被直接整合進使用者熟悉的應用程式與對話介面中,透過自然語言取代複雜的專業操作。

隨著這類技術的成熟,它將對內容創作、廣告行銷、個人娛樂等領域將產生深遠的影響,傳統影像處理軟體的工作流程與市場格局,也可能因此迎來新的變革。

首圖採用 Google Gemini AI 生成

Qwen Image AI 圖像模型效果佳,本地端 AI 算圖新選擇
標籤: AIAI產圖Gemini 2.5Google
Share3Tweet2ShareShareShare
上一篇

Salesloft Drift 整合漏洞災情擴大,多家企業的Salesforce 資料外流,科技大廠說明曝險範圍

下一篇

韓國專屬產業用 AI 觀察,特化版 AI 扮演製造加速器角色

Ashley Hsieh

Ashley Hsieh

專案管理者與 UI/UX 設計、AI美術設計認證、淨零碳規劃管理師,在上市歐洲外商、生醫、金融、科技產業中淬煉,曾參與過多個跨平台專案,從需求分析、設計、使用者測試到專案交付流程都樂在其中。 私底下,我是一位「喜歡買東西但錢包容易抗議」的人,對科技、設計與藝術有熱情,正在努力平衡質感生活,學習和錢包一起成長的日常小練習者。

相關文章

微軟 Copilot Studio 擴充套件正式版 VS Code 支援 AI 代理開發與 Git 協作
AI 人工智慧

微軟 Copilot Studio 擴充套件正式版 VS Code 支援 AI 代理開發與 Git 協作

2026 年 1 月 17 日
Grok 祭出地理封鎖與付費牆防堵 xAI 平台上的深偽影像
新聞

Grok 祭出地理封鎖與付費牆防堵 xAI 平台上的深偽影像

2026 年 1 月 17 日
4 秒出圖!FLUX.2 klein 正式登場,實測 BFL 新一代開源生圖模型,支援 NVFP4 與 4B 商用版
AI 人工智慧

4 秒出圖!FLUX.2 klein 正式登場,實測 BFL 新一代開源生圖模型,支援 NVFP4 與 4B 商用版

2026 年 1 月 17 日
麻省總醫院研發自主 AI 代理人團隊 準確偵測早期認知退化跡象
AI 人工智慧

麻省總醫院研發自主 AI 代理人團隊 準確偵測早期認知退化跡象

2026 年 1 月 16 日
中國祭出雙重科技禁令,封殺美國、以色列資安軟體並限制 Nvidia H200 晶片進口
AI 人工智慧

中國祭出雙重科技禁令,封殺美國、以色列資安軟體並限制 Nvidia H200 晶片進口

2026 年 1 月 16 日
Linux 之父擁抱 AI 新趨勢,Linus Torvalds 透過 Vibe Coding 開發專案
AI 人工智慧

Linux 之父擁抱 AI 新趨勢,Linus Torvalds 透過 Vibe Coding 開發專案

2026 年 1 月 15 日
下一篇
韓國專屬產業用 AI 觀察,特化版 AI 扮演製造加速器角色

韓國專屬產業用 AI 觀察,特化版 AI 扮演製造加速器角色

你們家的 AI 伺服器在網路上裸奔嗎 ? Cisco 揭露上千台 Ollama LLM 設備曝險門戶洞開

你們家的 AI 伺服器在網路上裸奔嗎 ? Cisco 揭露上千台 Ollama LLM 設備曝險門戶洞開

推薦閱讀

微軟 Copilot Studio 擴充套件正式版 VS Code 支援 AI 代理開發與 Git 協作

微軟 Copilot Studio 擴充套件正式版 VS Code 支援 AI 代理開發與 Git 協作

2026 年 1 月 17 日
Grok 祭出地理封鎖與付費牆防堵 xAI 平台上的深偽影像

Grok 祭出地理封鎖與付費牆防堵 xAI 平台上的深偽影像

2026 年 1 月 17 日
4 秒出圖!FLUX.2 klein 正式登場,實測 BFL 新一代開源生圖模型,支援 NVFP4 與 4B 商用版

4 秒出圖!FLUX.2 klein 正式登場,實測 BFL 新一代開源生圖模型,支援 NVFP4 與 4B 商用版

2026 年 1 月 17 日
麻省總醫院研發自主 AI 代理人團隊 準確偵測早期認知退化跡象

麻省總醫院研發自主 AI 代理人團隊 準確偵測早期認知退化跡象

2026 年 1 月 16 日
中國祭出雙重科技禁令,封殺美國、以色列資安軟體並限制 Nvidia H200 晶片進口

中國祭出雙重科技禁令,封殺美國、以色列資安軟體並限制 Nvidia H200 晶片進口

2026 年 1 月 16 日

近期熱門

  • Linux 之父擁抱 AI 新趨勢,Linus Torvalds 透過 Vibe Coding 開發專案

    Linux 之父擁抱 AI 新趨勢,Linus Torvalds 透過 Vibe Coding 開發專案

    158 shares
    Share 63 Tweet 40
  • 馬斯克揚言打造可抽雪茄吃漢堡的非典型 2 奈米製程晶圓廠可能嗎?

    132 shares
    Share 53 Tweet 33
  • Windows 11 2026 開年重要更新 KB5074109 釋出,4GB 安裝包背後的微軟 AI 布局

    108 shares
    Share 43 Tweet 27
  • 4 秒出圖!FLUX.2 klein 正式登場,實測 BFL 新一代開源生圖模型,支援 NVFP4 與 4B 商用版

    107 shares
    Share 43 Tweet 27
  • 它不是圖檔 ! 駭客利用 HTML 表格畫 QR Code 發動可躲過一般資安偵測的釣魚攻擊

    85 shares
    Share 34 Tweet 21
  • 中國祭出雙重科技禁令,封殺美國、以色列資安軟體並限制 Nvidia H200 晶片進口

    73 shares
    Share 29 Tweet 18
  • 蘋果宣布 Google Gemini 模型將成為新一代 Siri 核心基礎

    73 shares
    Share 29 Tweet 18
  • 麻省總醫院研發自主 AI 代理人團隊 準確偵測早期認知退化跡象

    67 shares
    Share 27 Tweet 17
  • Instagram 爆發嚴重資安外洩 1750 萬用戶資料遭公開

    97 shares
    Share 39 Tweet 24
  • Docker Engine 29.1.4 釋出,聚焦 Windows 穩定性與 Overlay2 儲存最佳化

    58 shares
    Share 23 Tweet 15

關於 CyberQ 賽博客

您的企業儲存、網路架構與資安科技好夥伴

專注於企業級網路與儲存環境建構、NAS 系統整合、資安解決方案與 AI 應用顧問服務,為您打造高可用、高安全、高效能的數位環境。

專業產業媒體 × 技術顧問團隊

我們關注新興科技趨勢,深入報導海內外產業動態,並結合多年實務經驗,提供量身打造的 IT 解決方案與精選內容。

我們提供的核心服務 : 

資安防護|網站開發與雲端服務|AI 導入與應用顧問|企業資訊環境建構|NAS 系統整合|數位內容產製|科技媒體|

CyberQ 致力於打造更智慧、更安全的數位未來。

新聞稿、採訪、授權、內容投訴、行銷合作、投稿刊登:service@cyberq.tw
廣告委刊、展覽會議、系統整合、資安顧問、業務提攜:service@cyberq.tw

Copyright ©2025 CyberQ.tw All Rights Reserved.

沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • Docker / 容器
    • 虛擬化
  • 基礎教學
    • NAS 基礎設定
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊

© 2025 CyberQ NAS、資安、資訊科技、AI應用的日常 關於 CyberQ 賽博客NAS 系統與電腦、手機一起的生活故事多年的系統整合與資訊安全經驗,協助智慧家居、小型工作室、辦公室與機構,導入更便利、更安全的資訊環境與應用。