過去幾年的 AI 圖像生成像是在開盲盒和玩大量抽卡,用戶輸入提示詞(Prompt)後只能祈禱模型拼湊出對的像素。但 OpenAI 於近日推出的 ChatGPT Images 2.0,讓大家耳目一新,確實讓 AI 繪圖進入了新時代。
CyberQ 實測 OpenAI 的 Images 2.0 ,它確實在畫質上大幅提升超越了競爭對手 Google Nano Banana 2,另外,根據最新出爐的大型模型盲測競技場(AI Arena / LM Arena)計分板數據,這款新模型以史無前例的高分差距碾壓了所有競爭對手。
AI Arena 創下歷史最大領先分差(+242分)
要客觀衡量一個 AI 模型的實力,基於人類盲測偏好的 LMSYS AI Arena (Text-to-Image 排行榜) 是目前業界具公信力的指標之一。
在 ChatGPT Images 2.0(底層模型 API 代號為 gpt-image-2)正式上線後,其跑分結果震驚了整個開源與開發者社群。

空降榜首與破紀錄分差顯著,GPT-Image-2 以壓倒性的優勢空降總榜冠軍,並拉開了與第二名 Google 旗艦模型 Nano Banana 2 高達 242 分的驚人差距。過去頂級模型之間的勝負通常只有十幾分之差,這次的表現被視為跨世代的碾壓(Generational Leap)。
全分類大滿貫在所有視覺子分類中皆拿下第一。特別是在文字渲染(Text Rendering)與人像寫實度(Portraits & Photorealism)上,都有極大幅度的提升。
CyberQ 指出,在 AI Arena 持續關注以來,實測的感想確實不錯,這個 242 分的領先差距確實不簡單。
以下是我們的一些測試提詞和成品 :
A cyberpunk street scene on a rainy night. Above a noodle stand hangs a bright, colorful neon sign. The sign clearly and correctly displays the Traditional Chinese characters ‘深夜食堂’. The rain reflects the neon lights on the asphalt, with futuristic skyscrapers in the background.

一張充滿活力的夏日特賣海報。畫面中央是一顆戴著太陽眼鏡的擬人化鳳梨。鳳梨的上方有巨大、鮮豔且帶有 3D 氣球立體效果的字體,明確寫著繁體中文夏日狂歡。背景是藍天白雲和金色的沙灘,整體色彩明亮活潑。

生成一張寫實風格的台灣夜市街景照片,畫面中央是一間小吃店,紅底白字直式招牌清楚寫著「賽博客蚵仔煎」,旁邊黃色橫式小招牌寫著「內用 外帶」,玻璃窗上貼著白紙黑字告示「今日公休後恢復營業」。整體要像真實攝影,招牌文字必須清楚、可讀、沒有錯字,風格為台北老街夜景,略帶雨後路面反光。

請生成一張台灣科技展覽會場的寫實主視覺海報,畫面中有大型 LED 螢幕、參展攤位與來往人群。海報上需出現以下清晰可讀的繁體中文資訊,並保持專業排版:主標題:「2026 智慧製造與 AI 資安展」副標題:「從邊緣運算、生成式 AI 到企業零信任架構」資訊列一:「展覽日期|2026 年 5 月 18 日-5 月 21 日」資訊列二:「展覽地點|台北南港展覽館二館」資訊列三:「論壇主題|半導體、伺服器、機器人與工業資安」右下角按鈕風格區塊寫:「立即報名」整體風格像國際級 B2B 展會主視覺,科技感強、燈光精緻、繁體中文必須完全正確、沒有亂碼、沒有錯字、沒有無意義字元。

CyberQ 認為,這些圖片的測試效果都還不錯,大家不妨嘗試看看和 Google Gemini 的 AI 產圖模型 Nana Banana 2 做比較。
ChatGPT Images 2.0 的四大革命性重點
根據 OpenAI 的官方公告,本次更新將圖像生成從單純的渲染工具提升為視覺思考夥伴(Visual Thought Partner),主要歸功於以下突破:

1、業界首創 AI 產圖的思考模式 (Thinking Capabilities)
這也是本次更新的重點,當用戶(Plus/Pro/Business/Enterprise)在 ChatGPT 中啟用思考模型時,AI 不會用過往的速度產生給你了,而是會先花時間進行更多的思考運作:
即時聯網查證:它可以主動搜尋網路即時資訊,確保生成的資料(如最新的天氣預報、產品資訊)符合現實。
強大的多圖一致性:只需一個提示詞,它就能一次生成最多 8 張角色、風格與場景完全一致的連貫圖像。這對於繪製漫畫分鏡、多頁簡報或品牌行銷素材來說,簡直是夢寐以求的功能。
2、告別AI 外星文,完美的中文與多語系渲染
過去 AI 繪圖最令人崩潰的缺點,就是圖片裡的文字永遠像外星文。Images 2.0 帶來了近乎完美的文字渲染技術,並大幅強化了非拉丁語系(特別是繁簡中文、日文、韓文 CJK)的支援。
現在,行銷人員可以直接請 AI 產出一張包含精準中文文案的宣傳海報、標註清晰的 UI 介面,甚至是寫滿公式的筆記,字體與間距皆自然流暢。
3、破除尺寸限制,極端長寬比與超高解析度
為真正打入商業工作流,Images 2.0 解除了以往的正方形構圖束縛。它支援從 3:1 到 1:3 的極端長寬比,這意味著超寬的網頁橫幅(Banner)或是手機直式全螢幕素材都能「開箱即用」。此外,API 端支援高達 2K(甚至更高)的解析度,滿足專業級的輸出需求。
4、具備世界物理常識的寫實感與精準編輯
Images 2.0 徹底移除了前代模型常見的「暖色 AI 濾鏡」,帶來中性、準確的相片級色彩。它更深入理解了現實的物理定律、光影衰減和複雜多物件的遮擋關係,大幅減少空間破綻。
此外,它支援高精度的遮罩編輯(Mask Support),可以只針對圖片的特定區域(如商品去背換背景)進行局部重繪(Inpainting/Outpainting),而不破壞原有構圖。
AI 視覺工作流的典範轉移
CyberQ 認為,高達 242 分的競技場差距很值得探究,當其他競爭對手還在努力讓圖畫得更漂亮時,OpenAI 已經讓 AI 提供理解你需要什麼的重點,其實就是提高它應對用戶提詞的反應能力,成為更好的 AI 產圖模型。ChatGPT Images 2.0 轉變能同時上網搜尋資料、自我檢查排版錯誤的視覺策劃平台。
目前,ChatGPT Images 2.0 已向 ChatGPT、Codex 與 API 用戶全面開放。這項更新無疑將徹底改寫平面設計師、行銷人員以及內容創作者的日常工作流,如果我們再搭配之前報導講過的 Claude Design,目前在設計領域的革命,已經確切地真實地發生了。
首圖與配圖由 ChatGPT Image 2.0 生成








