CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
  • 基礎教學
    • NAS 基礎設定
  • Docker / 容器
    • 虛擬化
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
聯繫我們
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
  • 基礎教學
    • NAS 基礎設定
  • Docker / 容器
    • 虛擬化
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
沒有結果
觀看所有搜尋結果
CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
  • 新聞
  • 基礎教學
  • Docker / 容器
  • 資安專區
  • AI 應用實戰
  • 進階應用
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
首頁 進階應用 AI 應用實戰

Qwen Image AI 圖像模型效果佳,本地端 AI 算圖新選擇

Icewind by Icewind
2025 年 8 月 7 日
Reading Time: 3 mins read
A A
Qwen Image AI 圖像模型效果佳,本地端 AI 算圖新選擇
10
分享數
201
觀看數
分享到臉書分享到 X分享到Line分享到 Threads分享到 Linkedin

你是否常覺得許多 AI 圖像生成模型對於文字應用在圖片上常常做不夠好或出現亂碼字? 除了英文外,其他語言文字未能盡善盡美? 繼 Black Forest Labs 的 FLUX.1 Kontext 將這方面效果做得更好後,近期 AI 算圖領域出現了一個新挑戰者,也就是中國阿里巴巴集團旗下「通義千問」(Qwen)團隊所開發的最新開源圖像生成模型 Qwen Image AI。

RELATED POSTS

QNAP NAS 導入 AI 自然語意智慧搜尋、RAG 多輪對話與智慧影像管理等重大更新

實測 Gemini「一鍵生成貼圖 2.0」的進化成果

新版升級的 Veo 3 影片生成 AI ,還整合進 Google Photos

Qwen Image AI 有多特別呢? 它可以正確地將中文字顯示在 AI 生成的圖片中,已經是接近商業用的品質,加上它的出圖效果優秀,迅速在全球 AI 社群中引起廣泛討論與關注。

姑且不論有沒有人為去加分,但根據阿里巴巴他們自己公開讓全球網友盲測圖片的網站 AI Arena ,其最新的 AI 圖像生成模型排行榜,Qwen Image 的表現已能與業界最頂尖的 AI 算圖模型並駕齊驅,為使用者提供了一個除了新秀FLUX.1 Kontext、老字號 Stable Diffusion 外,更加強大且可自訂的本地端 AI 算圖新選擇。

不僅懂畫,亦懂文字:Qwen Image 的優勢

傳統的 AI 圖像生成模型,長久以來在圖片中精準生成文字方面存在技術瓶頸,常出現文字錯亂、語意不符或無法處理複雜排版等問題。Qwen Image AI 的出現,採用一個擁有 200 億參數的多模態 DiT (Diffusion Transformer) 架構,並透過大量的圖文資料進行訓練,使其在理解和生成包含精確文字的圖像有比以往的模型表現再好一些。

圖片上文字功能: 無論是單行標題、多行段落,甚至是中英雙語混排,Qwen Image 都能完成,並保持語意的連貫性。這對於需要製作海報、簡報、資訊圖表等內容的創作者而言,是不錯的效果。但我們實際在本機上用 NVIDIA 顯示卡測試,在一堆文字的情況下,它還是會有錯誤的字元出現,但大部分能正確顯示出簡體中文字,繁體中文字有的還不一定完全正確,如下圖所示。

圖像編輯功能: Qwen Image 的圖像編輯功能,透過提示詞再對現有圖像進行風格轉換、物件增刪、細節強化,以及人物姿態的調整,增加後製彈性。

目前在實務上,已經可以在 Hugging Face 等網站下載 Qwen Image 模型來使用,我們則是使用 ComfyUI 搭配工作流來實測 :

AI Arena 排行榜上的成績

除了強大的功能,Qwen Image 的生成品質如果用盲測的話,會是怎樣的成績呢? 在由阿里巴巴自己做的全球使用者匿名投票評比網站,也就是前面我們提到的 AI Arena 圖像生成模型排行榜上,Qwen-Image 表現是看得到的,其主要成績如下:

綜合排名第三: 以2025年8月的數字來看,Qwen Image 以 1023 的 Elo 評分,僅次於 Google 的 Imagen 4 Ultra Preview 和字節跳動的 Seedream 3.0,居排行榜第三。

超越知名模型: Qwen Image 的評分超越了部分知名的競爭對手,包括 OpenAI 的 GPT Image 1 [High](987分)、Black Forest Labs 的 FLUX.1 Kontext [Pro](961分)以及 Ideogram 3.0(942分)。

如果不考慮線上的 AI 算圖模型,單純看可以在本地端跑的所有開源模型中,Qwen Image 的盲測排名可說是第一了,和 Black Forest Labs 的 FLUX.1 Kontext 產出相比,有不少部分是勝出的。

開源釋出意味著不只是本地端部署,還包括社群自己訓練出來的衍生版模型

相較於 Midjourney 等閉源的雲端服務,Qwen Image AI 的另一大吸引力在於其開源的特性。模型以 Apache 2.0 授權條款釋出,允許個人和企業自由地進行商業和非商業性的使用、修改與再發布。

和社群目前熱門的 FLUX.1 Kontext 一樣,使用者也不再需要將資料上傳至第三方伺服器,即可在自己的電腦上進行 AI 算圖,不僅保障了資料的隱私性與安全性,更提供了無限制的創作自由度,很多NSFW 的圖或被限制不能生成的圖,在這些開源模型中是可生成的。

目前,Qwen Image 的模型已在 Hugging Face 和 Github 等平台上公開,開發者和進階使用者可以根據官方提供的指南,將模型部署在本地端的個人電腦或伺服器上。雖然其 200 億的參數規模對硬體,特別是顯示卡記憶體(VRAM)有一定要求(官方建議需要 20GB 以上的顯卡會比較適合),但隨著社群對模型進行量化(Quantization)等最佳化技術的推進,在 16GB 顯卡上搭配 CPU 使用來執行已經成為可能,未來有機會在更廣泛的消費級顯卡的機器上執行。

Qwen Image AI 不僅在生成品質上備受矚目,其文字渲染能力算是改善了我們在業界關注的一項難題。想試試看比較沒有限制的創作嗎?

試試看在你自己的電腦、伺服器或 QNAP NAS 上去實作吧,在具備 NVIDIA 顯示卡的 NAS 上可以使用容器管理工具,在 ComfyUI 的容器中,掛載 Qwen Image 的 Node 來使用,下載對應的模型和相關檔案便能如上圖我們測試環境中去執行。

官方提供的技術文件

官方提供的測試連結 (在千問的頁面選圖像)

下載 Qwen Image 模型 : Hugging Face

本文最上方的標題特色圖片,由 AI 所產生。

標籤: AIAI產圖QwenQwen Image
Share4Tweet3ShareShareShare1
上一篇

Claude Opus 4.1 登場,程式開發再上一層樓,Anthropic 預告近日將再推更強大 AI 模型

下一篇

GPT-5 登場 API 大降價,聚焦 AI 程式開發輔助與自動選取模型

Icewind

Icewind

歷經數位內容、電商、資安、AI 與科技產業,擁有多年產業經驗,ISO 27001:2022 LA、ISO 27701:2019 LA。

相關文章文章

QNAP NAS 導入 AI 自然語意智慧搜尋、RAG 多輪對話與智慧影像管理等重大更新
AI 應用實戰

QNAP NAS 導入 AI 自然語意智慧搜尋、RAG 多輪對話與智慧影像管理等重大更新

2025 年 9 月 19 日
實測 Gemini「一鍵生成貼圖 2.0」的進化成果
AI 應用實戰

實測 Gemini「一鍵生成貼圖 2.0」的進化成果

2025 年 9 月 7 日
新版升級的 Veo 3 影片生成 AI ,還整合進 Google Photos
AI 應用實戰

新版升級的 Veo 3 影片生成 AI ,還整合進 Google Photos

2025 年 9 月 6 日
韓國專屬產業用 AI 觀察,特化版 AI 扮演製造加速器角色
AI 應用實戰

韓國專屬產業用 AI 觀察,特化版 AI 扮演製造加速器角色

2025 年 9 月 4 日
Gemini AI 影像編輯功能大升級:外觀一致性吸納了大量開發者與用戶
AI 應用實戰

Gemini AI 影像編輯功能大升級:外觀一致性吸納了大量開發者與用戶

2025 年 9 月 4 日
LLM 模型的參數量與系統需求資源概要
AI 應用實戰

LLM 模型的參數量與系統需求資源概要

2025 年 8 月 15 日
下一篇
GPT-5 登場 API 大降價,聚焦 AI 程式開發輔助與自動選取模型

GPT-5 登場 API 大降價,聚焦 AI 程式開發輔助與自動選取模型

主要 AI 模型 API 價格比較 (2025年8月版)

主要 AI 模型 API 價格比較 (2025年8月版)

推薦閱讀

主要 AI 模型 API 價格比較 (2025年8月版)

主要 AI 模型 API 價格比較 (2025年8月版)

2025 年 8 月 8 日
NVIDIA 釋出新版驅動程式 GeForce 580.88

NVIDIA 釋出新版驅動程式 GeForce 580.88

2025 年 8 月 2 日
WD 開第一槍!AI 資料中心需求引爆硬碟漲價潮,衝擊 NAS 與企業儲存成本

WD 開第一槍!AI 資料中心需求引爆硬碟漲價潮,衝擊 NAS 與企業儲存成本

2025 年 9 月 18 日

熱門文章

  • Salesloft Drift 整合漏洞災情擴大,多家企業的Salesforce 資料外流,科技大廠說明曝險範圍

    Salesloft Drift 整合漏洞災情擴大,多家企業的Salesforce 資料外流,科技大廠說明曝險範圍

    81 shares
    Share 32 Tweet 20
  • 在你的電腦與 NAS 上跑本地端 ChatGPT,OpenAI 釋出開源模型 gpt-oss

    38 shares
    Share 15 Tweet 10
  • 史上最薄 iPhone AIR 、iPhone 17 發表,搭載新 AI 功能,蘋果新品 AirPods Pro3、Apple Watch 11 亦高度整合 AI 功能

    28 shares
    Share 11 Tweet 7
  • Proxmox VE 9.0 正式發布,帶來多項重大更新與功能躍進

    27 shares
    Share 11 Tweet 7
  • 主要 AI 模型 API 價格比較 (2025年8月版)

    20 shares
    Share 8 Tweet 5

關於 CyberQ 賽博客

您的企業儲存、網路架構與資安科技好夥伴

專注於企業級網路與儲存環境建構、NAS 系統整合、資安解決方案與 AI 應用顧問服務,為您打造高可用、高安全、高效能的數位環境。

專業產業媒體 × 技術顧問團隊

我們關注新興科技趨勢,深入報導海內外產業動態,並結合多年實務經驗,提供量身打造的 IT 解決方案與精選內容。

核心服務|企業儲存與網路架構|資安策略與防護|NAS 系統整合|AI 實務應用|資訊科技顧問

CyberQ 致力於打造更智慧、更安全的數位未來。

新聞稿、採訪、授權、內容投訴、行銷合作、投稿刊登:service@cyberq.tw
廣告委刊、展覽會議、系統整合、資安顧問、業務提攜:service@cyberq.tw

Copyright ©2025 CyberQ.tw All Rights Reserved.

沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
  • 基礎教學
    • NAS 基礎設定
  • Docker / 容器
    • 虛擬化
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊

© 2025 CyberQ NAS、資安、資訊科技、AI應用的日常 關於 CyberQ 賽博客NAS 系統與電腦、手機一起的生活故事多年的系統整合與資訊安全經驗,協助智慧家居、小型工作室、辦公室與機構,導入更便利、更安全的資訊環境與應用。