Qwen3 系列模型再升級，從頂尖程式碼能力到多模態 AI 的全面進化

阿里雲（Alibaba Cloud）旗下的人工智慧團隊近期發表了其大規模語言模型 Qwen 系列的最新一代 Qwen3，從旗艦模型、視覺語言能力到全新的內容生成技術，全面展示了其在 AI 領域的強大企圖心與技術實力。

我們如果從下載數字來看，通義千問已累計開放 300+開源模型，覆蓋全尺寸、全模態模型，開源模型下載量已經突破6億次。這次新推出的該模型預訓練資料量達36T tokens，總參數超過兆，擁有極強的Coding程式設計能力和 AI Agent）=工具調用能力。

Qwen3-Max：挑戰程式碼開發與 AI 代理能力更上一層樓

作為系列中的旗艦模型，Qwen3-Max 在編碼（Coding）和代理（Agent）能力上獲得了顯著增強。根據官方資料，Qwen3-Max-Instruct 在多項權威評測中，無需經過複雜的思考鏈（Chain-of-Thought）或推理步驟，即可在 SWE-BenchMax、Tau2-Bench、SuperGPQA、LiveCodeBench 及 AIME25 等指標上不輸全球頂尖模型。

在處理真實世界問題的 SWE-Bench Verified 測試中，Instruct 版本斬獲69.6分，在聚焦Agent工具調用能力的Tau2-Bench測試中，Qwen3-Max取得突破性的74.8分，超過 Claude Opus4 和 DeepSeek-V3.1。

Qwen3-Max-Thinking-Heavy 在聚焦數學推理的AIME 25和HMMT測試中，均達到突破性的滿分100分。

這次的 Qwen3 系列模型升級意味著 Qwen3-Max 不僅在傳統的語言理解與生成任務上表現出色，更在需要高度邏輯推理和實作能力的專業領域，如軟體開發和複雜問題解決上，有不錯的成果。該公司官方文件已經開放讓各界使用 API 去呼叫 Qwen3-Max 來進行自己專案開發。

由於 Qwen 系列 API 完全相容 OpenAI API 格式，開發者可直接沿用 OpenAI 呼叫方式。以下是一個使用 Python 呼叫 Qwen3-Max-Instruct 的程式碼範例：

from openai import OpenAI
import os

client = OpenAI(
api_key=os.getenv(“API_KEY”),
base_url=”https://dashscope-intl.aliyuncs.com/compatible-mode/v1″,
)

completion = client.chat.completions.create(
model=”qwen3-max”,
messages=[
{‘role’: ‘user’, ‘content’: ‘Give me a short introduction to large language model.’}
]
)

print(completion.choices[0].message)

Qwen3-VL：從「看見」到「推理行動」的視覺語言模型

此模型不僅提升了對圖像的理解能力，更進化到能夠進行深度推理與採取行動，實現了從「看」（See）到「理解」（Understand），再到「推理與行動」（Reasoning and Action）的進步。

Qwen3-VL 推出了兩種不同定位的版本，以滿足多元化的應用需求：Instruct 版本，專為「直接執行、操作代理、日常應用」而設計。根據官方數據，其在多項視覺基準測試中的表現已超越 Google 的 Gemini 2.5 Pro，特別適合需要快速反應與精準執行的場景。

Thinking 版本，則專注於「深度推理、科研數學、長文本處理」。此版本在多模態推理能力上達到了業界頂尖（SOTA）水準，能應對更為複雜和需要深思熟慮的學術及專業任務。換言之，模態 AI 不再僅是簡單的圖像描述，而是具備了分析、推理並與數位世界互動的綜合能力。

Qwen3 加上 WAN 2.5 引起開發者社群高度關注

那麼，這次 Qwen3 系列與前代相比究竟有何不同？如果說前代模型是能力均衡的「全能通才」，Qwen3 則演化為特定任務時的「專家」，不再滿足於樣樣通，而是追求在特定領域的表現。例如，旗艦模型 Qwen3-Max 在程式碼與 Agent 能力上已能與世界頂級模型並駕齊驅，其強大的內在邏輯甚至無需複雜的提示工程就能處理高難度任務。同樣地，專為深度思考設計的 Qwen3-VL Thinking 版本，也直接鎖定過去模型難以處理的複雜學術研究，將「深度推理」打造成核心產品特性。

其次，是從「模組組合」到「原生多模態」的架構演進。過去的模型更像是將語言、視覺等功能分別開發再拼湊起來，而 Qwen3 從底層設計就統一考量該如何處理文字、圖像、聲音等多種不同的資料格式。

最新的 WAN-2.5 模型則更進一步地把「文字生成影片與聲音」這件事情做到更好，它所產生影片的效果，已經不輸 Google 的 Veo 3。

Qwen3 家族與 WAN 系列：建構全面的 AI 生態系

此次升級最顯著的變化之一，是其清晰完整的產品線佈局。Qwen3 形成了一個分工明確的「模型矩陣」，搭配全新的內容生成 WAN 系列，共同建構出一個全面的 AI 生態系。

Qwen3 系列產品結構：
Qwen3-Max (旗艦)：具備頂尖效能的核心模型。
Qwen3-VL (視覺語言)：從理解到行動的多模態專家。
Qwen3-Omni (全模態)：整合各種模態能力的通用模型。
Qwen3-Coder-Plus (程式強化)：專為程式碼開發升級的專業版。
Qwen3-Next (效率最佳化)：兼顧效能與資源效率的模型。

WAN 系列：
WAN-2.5-Preview：最新的文生影像與聲音模型，其技術目標直接對標 Google 的 Veo 3，預期將在多媒體內容創作領域將吸引到不少創作者與開發者投入。

CyberQ 認為，Qwen3 系列的發表，意義不只在於模型的升級，而是再次凸顯是中國 AI 技術團隊在底層技術到多元應用的表現已經在全球 AI 市場站穩腳步，如果說過去的 Qwen 系列為阿里雲累積了深厚的技術實力，那麼 Qwen3 就是奠基於此，往更專業、更整合的方向前進。

首圖由 Google Gemini AI 生成

標籤: AI Qwen Qwen3 阿里巴巴阿里雲

Qwen3 系列模型再升級，從頂尖程式碼能力到多模態 AI 的全面進化

OpenAI 狂募 1,220 億美元！估值破 8,520 億美元，宣告 AI 超級 App 戰略

Mac 本機跑模型速度翻倍！Ollama 正式支援 MLX，釋放 Apple Silicon 潛能

Oracle 預計裁員3萬人豪賭 AI 基礎建設

開發者如何使用 AI？Google 2025 DORA 報告解析

IBC 2025 現場直擊 – 從 8K 剪輯到 PB 級歸檔：QNAP 高速網路與儲存方案應對國際影視媒體產業資料洪流需求

Icewind

相關文章

OpenAI 狂募 1,220 億美元！估值破 8,520 億美元，宣告 AI 超級 App 戰略

Mac 本機跑模型速度翻倍！Ollama 正式支援 MLX，釋放 Apple Silicon 潛能

Oracle 預計裁員3萬人豪賭 AI 基礎建設

51 萬行程式碼機密外流！Claude Code 史詩級烏龍與開源神作 claw-code 的重生

Windows 11 緊急釋出頻外更新 KB5086672 修復 3 月可選更新 0x80073712 錯誤

NVIDIA Kimodo 專案實現生成式 AI + 人形機器人與 3D 動作控制的未來

IBC 2025 現場直擊 - 從 8K 剪輯到 PB 級歸檔：QNAP 高速網路與儲存方案應對國際影視媒體產業資料洪流需求

選哪一種記憶卡才安心? 從手機、遊戲機、無人機到專業監控，一次搞懂 MicroSD 卡選購指南

推薦閱讀

OpenAI 狂募 1,220 億美元！估值破 8,520 億美元，宣告 AI 超級 App 戰略

Mac 本機跑模型速度翻倍！Ollama 正式支援 MLX，釋放 Apple Silicon 潛能

Oracle 預計裁員3萬人豪賭 AI 基礎建設

51 萬行程式碼機密外流！Claude Code 史詩級烏龍與開源神作 claw-code 的重生

Windows 11 緊急釋出頻外更新 KB5086672 修復 3 月可選更新 0x80073712 錯誤

近期熱門

Windows 11 KB5079391 預覽版更新釋出，實測呈現記憶體用量降低與效能改善

Wine 11 核心級重構讓 Linux 遊戲體驗產生革命性突破

Mistral 推出開源語音生成模型 Voxtral 提升文字轉語音自然度

突破 LLM 記憶體之牆 ? 解析 GitHub 爆紅神作 TurboQuant+ 與 KV Cache 壓縮革命

2026 全球備份日：有備份不等於能還原，如何應對 AI 合規與勒索軟體雙重威脅

學歷貶值與 AI 轉型雙重夾擊！美國大學生求職信心跌破 20%，新鮮人如何靠實戰突圍？

為什麼 ChatGPT 突然不能打字？逆向工程揭密 Cloudflare 的隱藏防護機制

OpenAI 記憶體採購疑雲與新演算法壓縮技術大突破，記憶體價格出現下跌態勢?

你今天 import axios 了嗎？千萬下載量前端神級套件驚爆遭植入後門！

AI EXPO 2026 現場直擊 2：從技術宣示到企業落地，代理式 AI 開發架構、RAG 與資安合規成為核心重點

關於 CyberQ 賽博客

Qwen3 系列模型再升級，從頂尖程式碼能力到多模態 AI 的全面進化

RELATED POSTS

Qwen3-Max：挑戰程式碼開發與 AI 代理能力更上一層樓

Qwen3-VL：從「看見」到「推理行動」的視覺語言模型

Qwen3 加上 WAN 2.5 引起開發者社群高度關注

Qwen3 家族與 WAN 系列：建構全面的 AI 生態系

開發者如何使用 AI？Google 2025 DORA 報告解析

IBC 2025 現場直擊 – 從 8K 剪輯到 PB 級歸檔：QNAP 高速網路與儲存方案應對國際影視媒體產業資料洪流需求

相關文章

推薦閱讀

近期熱門

關於 CyberQ 賽博客