阿里雲(Alibaba Cloud)旗下的人工智慧團隊近期發表了其大規模語言模型 Qwen 系列的最新一代 Qwen3,從旗艦模型、視覺語言能力到全新的內容生成技術,全面展示了其在 AI 領域的強大企圖心與技術實力。
我們如果從下載數字來看,通義千問已累計開放 300+開源模型,覆蓋全尺寸、全模態模型,開源模型下載量已經突破6億次。這次新推出的該模型預訓練資料量達36T tokens,總參數超過兆,擁有極強的Coding程式設計能力和 AI Agent)=工具調用能力。
Qwen3-Max:挑戰程式碼開發與 AI 代理能力更上一層樓
作為系列中的旗艦模型,Qwen3-Max 在編碼(Coding)和代理(Agent)能力上獲得了顯著增強。根據官方資料,Qwen3-Max-Instruct 在多項權威評測中,無需經過複雜的思考鏈(Chain-of-Thought)或推理步驟,即可在 SWE-BenchMax、Tau2-Bench、SuperGPQA、LiveCodeBench 及 AIME25 等指標上不輸全球頂尖模型。

在處理真實世界問題的 SWE-Bench Verified 測試中,Instruct 版本斬獲69.6分,在聚焦Agent工具調用能力的Tau2-Bench測試中,Qwen3-Max取得突破性的74.8分,超過 Claude Opus4 和 DeepSeek-V3.1。

Qwen3-Max-Thinking-Heavy 在聚焦數學推理的AIME 25和HMMT測試中,均達到突破性的滿分100分。

這次的 Qwen3 系列模型升級意味著 Qwen3-Max 不僅在傳統的語言理解與生成任務上表現出色,更在需要高度邏輯推理和實作能力的專業領域,如軟體開發和複雜問題解決上,有不錯的成果。該公司官方文件已經開放讓各界使用 API 去呼叫 Qwen3-Max 來進行自己專案開發。
由於 Qwen 系列 API 完全相容 OpenAI API 格式,開發者可直接沿用 OpenAI 呼叫方式。以下是一個使用 Python 呼叫 Qwen3-Max-Instruct 的程式碼範例:
from openai import OpenAI
import os
client = OpenAI(
api_key=os.getenv(“API_KEY”),
base_url=”https://dashscope-intl.aliyuncs.com/compatible-mode/v1″,
)
completion = client.chat.completions.create(
model=”qwen3-max”,
messages=[
{‘role’: ‘user’, ‘content’: ‘Give me a short introduction to large language model.’}
]
)
print(completion.choices[0].message)
Qwen3-VL:從「看見」到「推理行動」的視覺語言模型
此模型不僅提升了對圖像的理解能力,更進化到能夠進行深度推理與採取行動,實現了從「看」(See)到「理解」(Understand),再到「推理與行動」(Reasoning and Action)的進步。
Qwen3-VL 推出了兩種不同定位的版本,以滿足多元化的應用需求:Instruct 版本,專為「直接執行、操作代理、日常應用」而設計。根據官方數據,其在多項視覺基準測試中的表現已超越 Google 的 Gemini 2.5 Pro,特別適合需要快速反應與精準執行的場景。
Thinking 版本,則專注於「深度推理、科研數學、長文本處理」。此版本在多模態推理能力上達到了業界頂尖(SOTA)水準,能應對更為複雜和需要深思熟慮的學術及專業任務。換言之,模態 AI 不再僅是簡單的圖像描述,而是具備了分析、推理並與數位世界互動的綜合能力。

Qwen3 加上 WAN 2.5 引起開發者社群高度關注
那麼,這次 Qwen3 系列與前代相比究竟有何不同?如果說前代模型是能力均衡的「全能通才」,Qwen3 則演化為特定任務時的「專家」,不再滿足於樣樣通,而是追求在特定領域的表現。例如,旗艦模型 Qwen3-Max 在程式碼與 Agent 能力上已能與世界頂級模型並駕齊驅,其強大的內在邏輯甚至無需複雜的提示工程就能處理高難度任務。同樣地,專為深度思考設計的 Qwen3-VL Thinking 版本,也直接鎖定過去模型難以處理的複雜學術研究,將「深度推理」打造成核心產品特性。
其次,是從「模組組合」到「原生多模態」的架構演進。過去的模型更像是將語言、視覺等功能分別開發再拼湊起來,而 Qwen3 從底層設計就統一考量該如何處理文字、圖像、聲音等多種不同的資料格式。
最新的 WAN-2.5 模型則更進一步地把「文字生成影片與聲音」這件事情做到更好,它所產生影片的效果,已經不輸 Google 的 Veo 3。
Qwen3 家族與 WAN 系列:建構全面的 AI 生態系
此次升級最顯著的變化之一,是其清晰完整的產品線佈局。Qwen3 形成了一個分工明確的「模型矩陣」,搭配全新的內容生成 WAN 系列,共同建構出一個全面的 AI 生態系。
Qwen3 系列產品結構:
Qwen3-Max (旗艦): 具備頂尖效能的核心模型。
Qwen3-VL (視覺語言): 從理解到行動的多模態專家。
Qwen3-Omni (全模態): 整合各種模態能力的通用模型。
Qwen3-Coder-Plus (程式強化): 專為程式碼開發升級的專業版。
Qwen3-Next (效率優化): 兼顧效能與資源效率的模型。
WAN 系列:
WAN-2.5-Preview: 最新的文生影像與聲音模型,其技術目標直接對標 Google 的 Veo 3,預期將在多媒體內容創作領域將吸引到不少創作者與開發者投入。
CyberQ 認為,Qwen3 系列的發表,意義不只在於模型的升級,而是再次凸顯是中國 AI 技術團隊在底層技術到多元應用的表現已經在全球 AI 市場站穩腳步,如果說過去的 Qwen 系列為阿里雲累積了深厚的技術實力,那麼 Qwen3 就是奠基於此,往更專業、更整合的方向前進。
本文題圖由 Google Gemini AI 生成