CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • 基礎教學
    • NAS 基礎設定
  • Docker / 容器
    • 虛擬化
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
聯繫我們
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • 基礎教學
    • NAS 基礎設定
  • Docker / 容器
    • 虛擬化
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
沒有結果
觀看所有搜尋結果
CyberQ 賽博客
沒有結果
觀看所有搜尋結果
  • Home
  • 新聞
  • 基礎教學
  • Docker / 容器
  • 資安專區
  • AI 應用實戰
  • 進階應用
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊
首頁 新聞 AI 人工智慧

Qwen Image AI 圖像模型效果佳,本地端 AI 算圖新選擇

Icewind by Icewind
2025 年 8 月 7 日
Reading Time: 3 mins read
A A
Qwen Image AI 圖像模型效果佳,本地端 AI 算圖新選擇
18
分享數
350
觀看數
分享到臉書分享到 X分享到Line分享到 Threads分享到 Linkedin

你是否常覺得許多 AI 圖像生成模型對於文字應用在圖片上常常做不夠好或出現亂碼字? 除了英文外,其他語言文字未能盡善盡美? 繼 Black Forest Labs 的 FLUX.1 Kontext 將這方面效果做得更好後,近期 AI 算圖領域出現了一個新挑戰者,也就是中國阿里巴巴集團旗下「通義千問」(Qwen)團隊所開發的最新開源圖像生成模型 Qwen Image AI。

RELATED POSTS

Cursor 宣布獲 Google、NVIDIA 注資 23 億美元 D 輪融資,AI 開發工具進入「百億估值」戰場

資安攻擊已近乎全自動:WSJ 揭密中國駭客利用 Anthropic AI 自主入侵

前 Google 執行長施密特憂心各國將因成本考量轉向採用中國開源 AI 模型

Qwen Image AI 有多特別呢? 它可以正確地將中文字顯示在 AI 生成的圖片中,已經是接近商業用的品質,加上它的出圖效果優秀,迅速在全球 AI 社群中引起廣泛討論與關注。

姑且不論有沒有人為去加分,但根據阿里巴巴他們自己公開讓全球網友盲測圖片的網站 AI Arena ,其最新的 AI 圖像生成模型排行榜,Qwen Image 的表現已能與業界最頂尖的 AI 算圖模型並駕齊驅,為使用者提供了一個除了新秀FLUX.1 Kontext、老字號 Stable Diffusion 外,更加強大且可自訂的本地端 AI 算圖新選擇。

不僅懂畫,亦懂文字:Qwen Image 的優勢

傳統的 AI 圖像生成模型,長久以來在圖片中精準生成文字方面存在技術瓶頸,常出現文字錯亂、語意不符或無法處理複雜排版等問題。Qwen Image AI 的出現,採用一個擁有 200 億參數的多模態 DiT (Diffusion Transformer) 架構,並透過大量的圖文資料進行訓練,使其在理解和生成包含精確文字的圖像有比以往的模型表現再好一些。

圖片上文字功能: 無論是單行標題、多行段落,甚至是中英雙語混排,Qwen Image 都能完成,並保持語意的連貫性。這對於需要製作海報、簡報、資訊圖表等內容的創作者而言,是不錯的效果。但我們實際在本機上用 NVIDIA 顯示卡測試,在一堆文字的情況下,它還是會有錯誤的字元出現,但大部分能正確顯示出簡體中文字,繁體中文字有的還不一定完全正確,如下圖所示。

圖像編輯功能: Qwen Image 的圖像編輯功能,透過提示詞再對現有圖像進行風格轉換、物件增刪、細節強化,以及人物姿態的調整,增加後製彈性。

目前在實務上,已經可以在 Hugging Face 等網站下載 Qwen Image 模型來使用,我們則是使用 ComfyUI 搭配工作流來實測 :

AI Arena 排行榜上的成績

除了強大的功能,Qwen Image 的生成品質如果用盲測的話,會是怎樣的成績呢? 在由阿里巴巴自己做的全球使用者匿名投票評比網站,也就是前面我們提到的 AI Arena 圖像生成模型排行榜上,Qwen-Image 表現是看得到的,其主要成績如下:

綜合排名第三: 以2025年8月的數字來看,Qwen Image 以 1023 的 Elo 評分,僅次於 Google 的 Imagen 4 Ultra Preview 和字節跳動的 Seedream 3.0,居排行榜第三。

超越知名模型: Qwen Image 的評分超越了部分知名的競爭對手,包括 OpenAI 的 GPT Image 1 [High](987分)、Black Forest Labs 的 FLUX.1 Kontext [Pro](961分)以及 Ideogram 3.0(942分)。

如果不考慮線上的 AI 算圖模型,單純看可以在本地端跑的所有開源模型中,Qwen Image 的盲測排名可說是第一了,和 Black Forest Labs 的 FLUX.1 Kontext 產出相比,有不少部分是勝出的。

開源釋出意味著不只是本地端部署,還包括社群自己訓練出來的衍生版模型

相較於 Midjourney 等閉源的雲端服務,Qwen Image AI 的另一大吸引力在於其開源的特性。模型以 Apache 2.0 授權條款釋出,允許個人和企業自由地進行商業和非商業性的使用、修改與再發布。

和社群目前熱門的 FLUX.1 Kontext 一樣,使用者也不再需要將資料上傳至第三方伺服器,即可在自己的電腦上進行 AI 算圖,不僅保障了資料的隱私性與安全性,更提供了無限制的創作自由度,很多NSFW 的圖或被限制不能生成的圖,在這些開源模型中是可生成的。

目前,Qwen Image 的模型已在 Hugging Face 和 Github 等平台上公開,開發者和進階使用者可以根據官方提供的指南,將模型部署在本地端的個人電腦或伺服器上。雖然其 200 億的參數規模對硬體,特別是顯示卡記憶體(VRAM)有一定要求(官方建議需要 20GB 以上的顯卡會比較適合),但隨著社群對模型進行量化(Quantization)等最佳化技術的推進,在 16GB 顯卡上搭配 CPU 使用來執行已經成為可能,未來有機會在更廣泛的消費級顯卡的機器上執行。

Qwen Image AI 不僅在生成品質上備受矚目,其文字渲染能力算是改善了我們在業界關注的一項難題。想試試看比較沒有限制的創作嗎?

試試看在你自己的電腦、伺服器或 QNAP NAS 上去實作吧,在具備 NVIDIA 顯示卡的 NAS 上可以使用容器管理工具,在 ComfyUI 的容器中,掛載 Qwen Image 的 Node 來使用,下載對應的模型和相關檔案便能如上圖我們測試環境中去執行。

官方提供的技術文件

官方提供的測試連結 (在千問的頁面選圖像)

下載 Qwen Image 模型 : Hugging Face

本文最上方的標題特色圖片,由 AI 所產生。

標籤: AIAI產圖QwenQwen Image
Share7Tweet5ShareShareShare1
上一篇

Claude Opus 4.1 登場,程式開發再上一層樓,Anthropic 預告近日將再推更強大 AI 模型

下一篇

GPT-5 登場 API 大降價,聚焦 AI 程式開發輔助與自動選取模型

Icewind

Icewind

歷經數位內容、電商、資安、AI 與科技產業,擁有多年產業經驗,ISO 27001:2022 LA、ISO 27701:2019 LA。

相關文章文章

Cursor 宣布獲 Google、NVIDIA 注資 23 億美元 D 輪融資,AI 開發工具進入「百億估值」戰場
AI 人工智慧

Cursor 宣布獲 Google、NVIDIA 注資 23 億美元 D 輪融資,AI 開發工具進入「百億估值」戰場

2025 年 11 月 14 日
資安攻擊已近乎全自動:WSJ 揭密中國駭客利用 Anthropic AI 自主入侵
AI 人工智慧

資安攻擊已近乎全自動:WSJ 揭密中國駭客利用 Anthropic AI 自主入侵

2025 年 11 月 14 日
前 Google 執行長施密特憂心各國將因成本考量轉向採用中國開源 AI 模型
AI 人工智慧

前 Google 執行長施密特憂心各國將因成本考量轉向採用中國開源 AI 模型

2025 年 11 月 14 日
Apple 擬砸 10 億美元向 Google 租用客製 Gemini?Siri「換腦計畫」背後的真相與新 AI 競局
AI 人工智慧

Apple 擬砸 10 億美元向 Google 租用客製 Gemini?Siri「換腦計畫」背後的真相與新 AI 競局

2025 年 11 月 14 日
晶片禁令下的軟體突圍,矽谷新創為何轉向擁抱中國AI模型 ?
AI 人工智慧

晶片禁令下的軟體突圍,矽谷新創為何轉向擁抱中國AI模型 ?

2025 年 11 月 13 日
Blender 於 NVIDIA DGX Spark GB10 平台成功執行,CUDA 與 OptiX 加速全開
AI 人工智慧

Blender 於 NVIDIA DGX Spark GB10 平台成功執行,CUDA 與 OptiX 加速全開

2025 年 11 月 13 日
下一篇
GPT-5 登場 API 大降價,聚焦 AI 程式開發輔助與自動選取模型

GPT-5 登場 API 大降價,聚焦 AI 程式開發輔助與自動選取模型

主要 AI 模型 API 價格比較 (2025年8月版)

主要 AI 模型 API 價格比較 (2025年8月版)

推薦閱讀

Pwn2Own Ireland 2025 首日戰報:34 個 0-day 全數命中,發出 52.2 萬美元獎金

Pwn2Own Ireland 2025 首日戰報:34 個 0-day 全數命中,發出 52.2 萬美元獎金

2025 年 10 月 25 日
AI正在悄悄取代職場新鮮人?史丹佛最新研究顯示職場正受到影響

AI正在悄悄取代職場新鮮人?史丹佛最新研究顯示職場正受到影響

2025 年 9 月 3 日
提升 NAS 勒索軟體防護:多層次資安佈局

提升 NAS 勒索軟體防護:多層次資安佈局

2025 年 10 月 6 日

熱門文章

  • Docker 29.0.0 重大更新,擁抱 nftables 與 cgroup v2,但開發者應注意多項變更調整

    Docker 29.0.0 重大更新,擁抱 nftables 與 cgroup v2,但開發者應注意多項變更調整

    20 shares
    Share 8 Tweet 5
  • 用 Watchtower 協助 Docker 容器永續自動更新,解放你的維運壓力

    20 shares
    Share 8 Tweet 5
  • NVIDIA DGX Spark GB10 發售次月現況,用戶逐步打造小型 AI 運算叢集

    17 shares
    Share 7 Tweet 4
  • OpenAI 正式推出 GPT-5.1 強化推理能力與人性化互動體驗

    16 shares
    Share 6 Tweet 4
  • 資安攻擊已近乎全自動:WSJ 揭密中國駭客利用 Anthropic AI 自主入侵

    16 shares
    Share 6 Tweet 4

關於 CyberQ 賽博客

您的企業儲存、網路架構與資安科技好夥伴

專注於企業級網路與儲存環境建構、NAS 系統整合、資安解決方案與 AI 應用顧問服務,為您打造高可用、高安全、高效能的數位環境。

專業產業媒體 × 技術顧問團隊

我們關注新興科技趨勢,深入報導海內外產業動態,並結合多年實務經驗,提供量身打造的 IT 解決方案與精選內容。

我們提供的核心服務 : 

資安防護|網站開發與雲端服務|AI 導入與應用顧問|企業資訊環境建構|NAS 系統整合|數位內容產製|科技媒體|

CyberQ 致力於打造更智慧、更安全的數位未來。

新聞稿、採訪、授權、內容投訴、行銷合作、投稿刊登:service@cyberq.tw
廣告委刊、展覽會議、系統整合、資安顧問、業務提攜:service@cyberq.tw

Copyright ©2025 CyberQ.tw All Rights Reserved.

沒有結果
觀看所有搜尋結果
  • Home
    • 關於我們
    • 隱私權政策
  • 新聞
    • AI 人工智慧
  • 基礎教學
    • NAS 基礎設定
  • Docker / 容器
    • 虛擬化
  • 資安專區
    • ISO 合規
  • AI 應用實戰
  • 進階應用
    • DevOps
    • 程式開發
    • 企業解決方案
  • DR.Q 快問快答
  • 開箱測試
  • 展覽直擊

© 2025 CyberQ NAS、資安、資訊科技、AI應用的日常 關於 CyberQ 賽博客NAS 系統與電腦、手機一起的生活故事多年的系統整合與資訊安全經驗,協助智慧家居、小型工作室、辦公室與機構,導入更便利、更安全的資訊環境與應用。