CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • Docker / 容器
    • 虛擬化
  • 基礎教學
    • NAS 基礎設定
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
聯繫我們
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • Docker / 容器
    • 虛擬化
  • 基礎教學
    • NAS 基礎設定
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
沒有結果
觀看所有搜尋結果
CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
  • 新聞
  • 資安專區
  • AI 應用實戰
  • Docker / 容器
  • 基礎教學
  • 進階應用
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
首頁 新聞 AI 人工智慧

Gemini AI 影像編輯功能大升級:外觀一致性吸納了大量開發者與用戶

Ashley Hsieh by Ashley Hsieh
2025 年 9 月 4 日
閱讀時間: 2 分鐘
A A
Gemini AI 影像編輯功能大升級:外觀一致性吸納了大量開發者與用戶
8
分享數
169
觀看數
分享到臉書分享到 X分享到Line分享到 Threads分享到 Linkedin

Google DeepMind 近期發布了 Gemini 應用程式中一項重大的功能升級。之前我們有做過這篇報導 :

RELATED POSTS

從奢侈品變必需品:回顧 SSL 憑證市場十年來的「免費革命」與未來

用 Gemini Pro 3 打造 2035 年 Hacker News 首頁預言 充滿 AI 諷刺與訂閱制地獄

GPT-5.2 登場,成人模式將於 2026 解禁,迪士尼入股 OpenAI 並授權 IP 給 Sora

Gemini 2.5 Flash Image 突破當前 AI 圖片生成與編輯天花板

繼續深入探究這次更新的重點,是解決長期以來 AI 圖片編輯在修改人物或寵物照片時,普遍存在的「樣貌失真」問題。透過更先進的上下文理解與生成能力,新模型讓使用者能以自然語言進行精細、多輪的圖片編輯,同時確保主體(如人臉、寵物特徵)的高度一致性,吸引了全球大量的開發者與用戶持續在 Google Gemini AI 平台和 Imagen4 平台上使用。

很多開發者只要付費使用 Gemini 圖像生成 Api ,就可以做出很好用的衣服試穿網站、AI 換臉、AI 專業肖像照合成等多種網站或 App 服務,基於 Google Gemini Api 的產業端圖片應用也正蓬勃發展。

核心技術突破:維持「外觀一致性」

過去,使用者在利用 AI 工具為照片中的人物更換服裝或背景時,常會發現主角的臉部特徵或神韻也跟著產生微妙、甚至明顯的變化,生成結果「相似,但又不完全是同一個人」。Google 這次更新的關鍵技術突破,便在於維持樣貌的一致性 (Appearance Consistency)。

使用者現在可以透過 Gemini 執行以下複雜的編輯任務,而無需擔心主角失真,還可以將特定人物或寵物的照片,無縫置入全新的場景,例如把一張在客廳拍攝的寵物照,背景更換為「正在外太空漫步」;或為人物「換上一套未來感的盔甲」、「將直髮換成捲髮」等。模型更支援將不同照片中的人物或寵物提取出來,能將多張不同照片自然地融合到同一張新的圖片中,創造出全新的合照。使用者還能上傳一張參考圖片,將其獨特的藝術風格(例如油畫的筆觸、特定電影的色調)應用到自己想要編輯的照片上。

操作流程革新:多輪對話式編輯

除了生成品質的提升,Gemini 在人機互動流程上也進行了革新,引入了多輪對話式編輯 (Multi-turn, Conversational Editing) 的概念。這徹底改變了傳統圖片編輯軟體需要精通複雜工具欄的模式,也超越了多數 AI 工具「一次性 Prompt 指令」的限制,其工作流程更接近與一位專業設計師的溝通,使用者上傳圖片後,可以透過下達語言指令對圖面進行局部編輯,例如「把這件藍色外套拿掉」。

在 Gemini 產生初步結果後,使用者可以繼續下達一系列的追問指令來進行微調,例如「幫他穿上一件黑色皮夾克」、「讓夾克看起來舊一點,多點磨損痕跡」、「背景加上下雨的街景」,模型會理解上下文,持續在同一張圖片上進行疊代修改。這種對話式的流程,極大地降低了專業影像編輯的門檻,讓普通使用者也能透過簡單的口語化指令,完成精細的創意修改。

AI 倫理與透明度實踐

面對生成式 AI 內容可能被濫用的疑慮,Google 在此次更新中也強調了其在責任與透明度上的實踐。所有透過 Gemini 應用程式建立或進行大幅度編輯的圖片,都會被嵌入兩種標記:可見浮水印(在圖片上直接加入標示,表明其為 AI 生成)、SynthID 數位浮水印(一種嵌入在圖片像素中,肉眼無法察覺的數位浮水印,能更穩定地標示其來源,即便經過裁切或壓縮等修改,仍有機會被偵測)。

CyberQ 觀點 : 精準編輯將帶來業界的改變

Gemini 此次的影像編輯功能升級,不僅僅是單點的技術展示,它更揭示了未來 AI 工具發展已經從「生成」到「精準編輯」,AI 的能力正從天馬行空的「無中生有」,進化到能理解並精準修改現有內容的細節,這使其在專業工作流程中的實用性大幅提升,強大的 AI 功能正被直接整合進使用者熟悉的應用程式與對話介面中,透過自然語言取代複雜的專業操作。

隨著這類技術的成熟,它將對內容創作、廣告行銷、個人娛樂等領域將產生深遠的影響,傳統影像處理軟體的工作流程與市場格局,也可能因此迎來新的變革。

首圖採用 Google Gemini AI 生成

Qwen Image AI 圖像模型效果佳,本地端 AI 算圖新選擇
標籤: AIAI產圖Gemini 2.5Google
Share3Tweet2ShareShareShare1
上一篇

Salesloft Drift 整合漏洞災情擴大,多家企業的Salesforce 資料外流,科技大廠說明曝險範圍

下一篇

韓國專屬產業用 AI 觀察,特化版 AI 扮演製造加速器角色

Ashley Hsieh

Ashley Hsieh

專案管理者與 UI/UX 設計、AI美術設計認證、淨零碳規劃管理師,在上市歐洲外商、生醫、金融、科技產業中淬煉,曾參與過多個跨平台專案,從需求分析、設計、使用者測試到專案交付流程都樂在其中。 私底下,我是一位「喜歡買東西但錢包容易抗議」的人,對科技、設計與藝術有熱情,正在努力平衡質感生活,學習和錢包一起成長的日常小練習者。

相關文章

從奢侈品變必需品:回顧 SSL 憑證市場十年來的「免費革命」與未來
新聞

從奢侈品變必需品:回顧 SSL 憑證市場十年來的「免費革命」與未來

2025 年 12 月 12 日
用 Gemini Pro 3 打造 2035 年 Hacker News 首頁預言 充滿 AI 諷刺與訂閱制地獄
AI 人工智慧

用 Gemini Pro 3 打造 2035 年 Hacker News 首頁預言 充滿 AI 諷刺與訂閱制地獄

2025 年 12 月 12 日
GPT-5.2 登場,成人模式將於 2026 解禁,迪士尼入股 OpenAI 並授權 IP 給 Sora
AI 人工智慧

GPT-5.2 登場,成人模式將於 2026 解禁,迪士尼入股 OpenAI 並授權 IP 給 Sora

2025 年 12 月 12 日
還我乾淨 Windows!兩大開源神器 RemoveWindowsAI vs Win11Debloat:一鍵斬斷 Copilot 與廣告追蹤
基礎教學

還我乾淨 Windows!兩大開源神器 RemoveWindowsAI vs Win11Debloat:一鍵斬斷 Copilot 與廣告追蹤

2025 年 12 月 12 日
新版ComfyUI v0.4.0 大幅降低 VRAM 用量,V3 架構全部部署
AI 人工智慧

新版ComfyUI v0.4.0 大幅降低 VRAM 用量,V3 架構全部部署

2025 年 12 月 11 日
GPT-Image-2 悄悄測試中?代號為 「Hazel-gen」 的神秘圖像生成模型
AI 人工智慧

GPT-Image-2 悄悄測試中?代號為 「Hazel-gen」 的神秘圖像生成模型

2025 年 12 月 11 日
下一篇
韓國專屬產業用 AI 觀察,特化版 AI 扮演製造加速器角色

韓國專屬產業用 AI 觀察,特化版 AI 扮演製造加速器角色

你們家的 AI 伺服器在網路上裸奔嗎 ? Cisco 揭露上千台 Ollama LLM 設備曝險門戶洞開

你們家的 AI 伺服器在網路上裸奔嗎 ? Cisco 揭露上千台 Ollama LLM 設備曝險門戶洞開

推薦閱讀

從奢侈品變必需品:回顧 SSL 憑證市場十年來的「免費革命」與未來

從奢侈品變必需品:回顧 SSL 憑證市場十年來的「免費革命」與未來

2025 年 12 月 12 日
用 Gemini Pro 3 打造 2035 年 Hacker News 首頁預言 充滿 AI 諷刺與訂閱制地獄

用 Gemini Pro 3 打造 2035 年 Hacker News 首頁預言 充滿 AI 諷刺與訂閱制地獄

2025 年 12 月 12 日
GPT-5.2 登場,成人模式將於 2026 解禁,迪士尼入股 OpenAI 並授權 IP 給 Sora

GPT-5.2 登場,成人模式將於 2026 解禁,迪士尼入股 OpenAI 並授權 IP 給 Sora

2025 年 12 月 12 日

近期熱門

  • LINE、Meta、Google 與小紅書的反詐騙治理比較

    LINE、Meta、Google 與小紅書的反詐騙治理比較

    234 shares
    Share 94 Tweet 59
  • 沒學歷也能進 OpenAI 當工程師,AI 時代大學教育價值正在崩解

    193 shares
    Share 77 Tweet 48
  • 韓國大批監控影像遭駭外流 IP攝影機資安與私有雲監控重視度大幅提高

    177 shares
    Share 71 Tweet 44
  • Windows 11 更新 KB5072033 終於修正了白閃問題,亦針對 Copilot 與檔案總管最佳化

    175 shares
    Share 70 Tweet 44
  • Anthropic 發布 AI 面談工具 解析逾千名專業工作者對人工智慧的真實觀點

    165 shares
    Share 66 Tweet 41
  • 新版ComfyUI v0.4.0 大幅降低 VRAM 用量,V3 架構全部部署

    152 shares
    Share 61 Tweet 38
  • 擺脫盲鑽高風險 新創 Zanskar 運用 AI 成功尋找隱藏地熱資源

    133 shares
    Share 53 Tweet 33
  • DeepMind與Anthropic執行長同聲示警 邁向AGI的關鍵十年與風險

    131 shares
    Share 52 Tweet 33
  • 價值24萬史丹佛AI課程免費公開 詳解大型語言模型底層技術

    127 shares
    Share 51 Tweet 32
  • Proxmox 雙箭齊發:Datacenter Manager 1.0 正式登場,PVE 9.1.2 補足拼圖

    130 shares
    Share 52 Tweet 33

關於 CyberQ 賽博客

您的企業儲存、網路架構與資安科技好夥伴

專注於企業級網路與儲存環境建構、NAS 系統整合、資安解決方案與 AI 應用顧問服務,為您打造高可用、高安全、高效能的數位環境。

專業產業媒體 × 技術顧問團隊

我們關注新興科技趨勢,深入報導海內外產業動態,並結合多年實務經驗,提供量身打造的 IT 解決方案與精選內容。

我們提供的核心服務 : 

資安防護|網站開發與雲端服務|AI 導入與應用顧問|企業資訊環境建構|NAS 系統整合|數位內容產製|科技媒體|

CyberQ 致力於打造更智慧、更安全的數位未來。

新聞稿、採訪、授權、內容投訴、行銷合作、投稿刊登:service@cyberq.tw
廣告委刊、展覽會議、系統整合、資安顧問、業務提攜:service@cyberq.tw

Copyright ©2025 CyberQ.tw All Rights Reserved.

沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • Docker / 容器
    • 虛擬化
  • 基礎教學
    • NAS 基礎設定
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊

© 2025 CyberQ NAS、資安、資訊科技、AI應用的日常 關於 CyberQ 賽博客NAS 系統與電腦、手機一起的生活故事多年的系統整合與資訊安全經驗,協助智慧家居、小型工作室、辦公室與機構,導入更便利、更安全的資訊環境與應用。