CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
  • 基礎教學
    • NAS 基礎設定
  • Docker / 容器
    • 虛擬化
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
聯繫我們
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
  • 基礎教學
    • NAS 基礎設定
  • Docker / 容器
    • 虛擬化
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
沒有結果
觀看所有搜尋結果
CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
  • 新聞
  • 基礎教學
  • Docker / 容器
  • 資安專區
  • AI 應用實戰
  • 進階應用
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
首頁 新聞 AI 人工智慧

Gemini AI 影像編輯功能大升級:外觀一致性吸納了大量開發者與用戶

Ashley Hsieh by Ashley Hsieh
2025 年 9 月 4 日
Reading Time: 2 mins read
A A
Gemini AI 影像編輯功能大升級:外觀一致性吸納了大量開發者與用戶
7
分享數
138
觀看數
分享到臉書分享到 X分享到Line分享到 Threads分享到 Linkedin

Google DeepMind 近期發布了 Gemini 應用程式中一項重大的功能升級。之前我們有做過這篇報導 :

RELATED POSTS

新品聚焦不中斷服務、AI 與資料韌性 – QNAP World Tour 2025 台北展場直擊

Backblaze 13 年資料呈現硬碟可靠度真相,當代硬碟壽命比預期更持久

PaaS vs. VPS:Idealist.org 如何將 3,000 美元月帳單降至 55 美元,大幅節省費用背後的營運風險與技術權衡

Gemini 2.5 Flash Image 突破當前 AI 圖片生成與編輯天花板

繼續深入探究這次更新的重點,是解決長期以來 AI 圖片編輯在修改人物或寵物照片時,普遍存在的「樣貌失真」問題。透過更先進的上下文理解與生成能力,新模型讓使用者能以自然語言進行精細、多輪的圖片編輯,同時確保主體(如人臉、寵物特徵)的高度一致性,吸引了全球大量的開發者與用戶持續在 Google Gemini AI 平台和 Imagen4 平台上使用。

很多開發者只要付費使用 Gemini 圖像生成 Api ,就可以做出很好用的衣服試穿網站、AI 換臉、AI 專業肖像照合成等多種網站或 App 服務,基於 Google Gemini Api 的產業端圖片應用也正蓬勃發展。

核心技術突破:維持「外觀一致性」

過去,使用者在利用 AI 工具為照片中的人物更換服裝或背景時,常會發現主角的臉部特徵或神韻也跟著產生微妙、甚至明顯的變化,生成結果「相似,但又不完全是同一個人」。Google 這次更新的關鍵技術突破,便在於維持樣貌的一致性 (Appearance Consistency)。

使用者現在可以透過 Gemini 執行以下複雜的編輯任務,而無需擔心主角失真,還可以將特定人物或寵物的照片,無縫置入全新的場景,例如把一張在客廳拍攝的寵物照,背景更換為「正在外太空漫步」;或為人物「換上一套未來感的盔甲」、「將直髮換成捲髮」等。模型更支援將不同照片中的人物或寵物提取出來,能將多張不同照片自然地融合到同一張新的圖片中,創造出全新的合照。使用者還能上傳一張參考圖片,將其獨特的藝術風格(例如油畫的筆觸、特定電影的色調)應用到自己想要編輯的照片上。

操作流程革新:多輪對話式編輯

除了生成品質的提升,Gemini 在人機互動流程上也進行了革新,引入了多輪對話式編輯 (Multi-turn, Conversational Editing) 的概念。這徹底改變了傳統圖片編輯軟體需要精通複雜工具欄的模式,也超越了多數 AI 工具「一次性 Prompt 指令」的限制,其工作流程更接近與一位專業設計師的溝通,使用者上傳圖片後,可以透過下達語言指令對圖面進行局部編輯,例如「把這件藍色外套拿掉」。

在 Gemini 產生初步結果後,使用者可以繼續下達一系列的追問指令來進行微調,例如「幫他穿上一件黑色皮夾克」、「讓夾克看起來舊一點,多點磨損痕跡」、「背景加上下雨的街景」,模型會理解上下文,持續在同一張圖片上進行疊代修改。這種對話式的流程,極大地降低了專業影像編輯的門檻,讓普通使用者也能透過簡單的口語化指令,完成精細的創意修改。

AI 倫理與透明度實踐

面對生成式 AI 內容可能被濫用的疑慮,Google 在此次更新中也強調了其在責任與透明度上的實踐。所有透過 Gemini 應用程式建立或進行大幅度編輯的圖片,都會被嵌入兩種標記:可見浮水印(在圖片上直接加入標示,表明其為 AI 生成)、SynthID 數位浮水印(一種嵌入在圖片像素中,肉眼無法察覺的數位浮水印,能更穩定地標示其來源,即便經過裁切或壓縮等修改,仍有機會被偵測)。

CyberQ 觀點 : 精準編輯將帶來業界的改變

Gemini 此次的影像編輯功能升級,不僅僅是單點的技術展示,它更揭示了未來 AI 工具發展已經從「生成」到「精準編輯」,AI 的能力正從天馬行空的「無中生有」,進化到能理解並精準修改現有內容的細節,這使其在專業工作流程中的實用性大幅提升,強大的 AI 功能正被直接整合進使用者熟悉的應用程式與對話介面中,透過自然語言取代複雜的專業操作。

隨著這類技術的成熟,它將對內容創作、廣告行銷、個人娛樂等領域將產生深遠的影響,傳統影像處理軟體的工作流程與市場格局,也可能因此迎來新的變革。

本文題圖採用 Google Gemini AI 生成

Qwen Image AI 圖像模型效果佳,本地端 AI 算圖新選擇
標籤: AIAI產圖Gemini 2.5Google
Share3Tweet2ShareShareShare
上一篇

Salesloft Drift 整合漏洞災情擴大,多家企業的Salesforce 資料外流,科技大廠說明曝險範圍

下一篇

韓國專屬產業用 AI 觀察,特化版 AI 扮演製造加速器角色

Ashley Hsieh

Ashley Hsieh

專案管理者與 UI/UX 設計,在上市歐洲外商、生醫、金融、科技產業中淬煉直觀好用的產品體驗。曾參與過多個跨平台專案,從需求分析、流程設計、使用者測試到專案交付流程都樂在其中。 私底下,我是一位「喜歡買東西但錢包容易抗議」的人,對科技、設計與藝術有熱情,正在努力平衡質感生活,學習和錢包一起成長的日常小練習者。

相關文章文章

新品聚焦不中斷服務、AI 與資料韌性 – QNAP World Tour 2025 台北展場直擊
展覽直擊

新品聚焦不中斷服務、AI 與資料韌性 – QNAP World Tour 2025 台北展場直擊

2025 年 10 月 24 日
Backblaze 13 年資料呈現硬碟可靠度真相,當代硬碟壽命比預期更持久
新聞

Backblaze 13 年資料呈現硬碟可靠度真相,當代硬碟壽命比預期更持久

2025 年 10 月 23 日
PaaS vs. VPS:Idealist.org 如何將 3,000 美元月帳單降至 55 美元,大幅節省費用背後的營運風險與技術權衡
DevOps

PaaS vs. VPS:Idealist.org 如何將 3,000 美元月帳單降至 55 美元,大幅節省費用背後的營運風險與技術權衡

2025 年 10 月 22 日
AI 也會「腦腐失智」!研究揭露垃圾資料讓 LLM 出現認知退化與黑暗特質
新聞

AI 也會「腦腐失智」!研究揭露垃圾資料讓 LLM 出現認知退化與黑暗特質

2025 年 10 月 22 日
微軟發布緊急 OOB 更新 KB5070773,修復 Windows 11 24H2/25H2 關鍵 WinRE 故障
DR.Q 快問快答

微軟發布緊急 OOB 更新 KB5070773,修復 Windows 11 24H2/25H2 關鍵 WinRE 故障

2025 年 10 月 21 日
AWS US-EAST-1 異常掀全球災情:Snapchat、Canva、Duolingo、Fortnite 全掛,陸續恢復上線
新聞

AWS US-EAST-1 異常掀全球災情:Snapchat、Canva、Duolingo、Fortnite 全掛,陸續恢復上線

2025 年 10 月 20 日
下一篇
韓國專屬產業用 AI 觀察,特化版 AI 扮演製造加速器角色

韓國專屬產業用 AI 觀察,特化版 AI 扮演製造加速器角色

你們家的 AI 伺服器在網路上裸奔嗎 ? Cisco 揭露上千台 Ollama LLM 設備曝險門戶洞開

你們家的 AI 伺服器在網路上裸奔嗎 ? Cisco 揭露上千台 Ollama LLM 設備曝險門戶洞開

推薦閱讀

QNAP 新版韌體 5.2.6.3195 更新 (QTS / QuTS hero)

QNAP 新版韌體 5.2.6.3195 更新 (QTS / QuTS hero)

2025 年 7 月 30 日
OpenAI GPT‑5‑Codex 登場,更融進工程師日常,開發者怎麼看?

OpenAI GPT‑5‑Codex 登場,更融進工程師日常,開發者怎麼看?

2025 年 9 月 16 日
Redis 的 CVSS 10 分漏洞「RediShell」曝光,從 Lua 沙箱逃逸到主機完全接管的資安災難

Redis 的 CVSS 10 分漏洞「RediShell」曝光,從 Lua 沙箱逃逸到主機完全接管的資安災難

2025 年 10 月 8 日

熱門文章

  • Salesloft Drift 整合漏洞災情擴大,多家企業的Salesforce 資料外流,科技大廠說明曝險範圍

    Salesloft Drift 整合漏洞災情擴大,多家企業的Salesforce 資料外流,科技大廠說明曝險範圍

    83 shares
    Share 33 Tweet 21
  • 高通併購 Arduino,Uno Q 問世,自造者社群與開源硬體生態邁向 AI 運算與機器人新時代

    60 shares
    Share 24 Tweet 15
  • 在你的電腦與 NAS 上跑本地端 ChatGPT,OpenAI 釋出開源模型 gpt-oss

    49 shares
    Share 20 Tweet 12
  • Windows 11 25H2 正式釋出,ISO檔與小更新檔均可部署

    45 shares
    Share 18 Tweet 11
  • Windows 10 大限將至!OT 及舊裝置如何透過微軟 ESU 計畫續命一年?

    37 shares
    Share 15 Tweet 9

關於 CyberQ 賽博客

您的企業儲存、網路架構與資安科技好夥伴

專注於企業級網路與儲存環境建構、NAS 系統整合、資安解決方案與 AI 應用顧問服務,為您打造高可用、高安全、高效能的數位環境。

專業產業媒體 × 技術顧問團隊

我們關注新興科技趨勢,深入報導海內外產業動態,並結合多年實務經驗,提供量身打造的 IT 解決方案與精選內容。

我們提供的核心服務 : 

資安防護|網站開發與雲端服務|AI 導入與應用顧問|企業資訊環境建構|NAS 系統整合|數位內容產製|科技媒體|

CyberQ 致力於打造更智慧、更安全的數位未來。

新聞稿、採訪、授權、內容投訴、行銷合作、投稿刊登:service@cyberq.tw
廣告委刊、展覽會議、系統整合、資安顧問、業務提攜:service@cyberq.tw

Copyright ©2025 CyberQ.tw All Rights Reserved.

沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
  • 基礎教學
    • NAS 基礎設定
  • Docker / 容器
    • 虛擬化
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊

© 2025 CyberQ NAS、資安、資訊科技、AI應用的日常 關於 CyberQ 賽博客NAS 系統與電腦、手機一起的生活故事多年的系統整合與資訊安全經驗,協助智慧家居、小型工作室、辦公室與機構,導入更便利、更安全的資訊環境與應用。