Amazon 投資的人工智慧公司 Anthropic 在日前發表了其最新模型 Claude Opus 4.1,是他們在AI代理任務、真實世界程式碼撰寫及推理能力上的新突破,讓程式開發相關任務的產出更上一層樓,不但如此 Anthropic 更預告,一場更大幅度的模型更新將在未來數周內推出。
Claude Opus 4.1 受到市場重視是著眼於其 AI 代理任務的表現,這次的更新包括下列重點:
更強的代理任務能力: Opus 4.1 在執行複雜且長期的任務時,表現出更佳的自主性與準確性。它能更有效地進行深度研究、數據分析,尤其在細節追蹤和代理搜索方面能力突出,能夠更長時間地維持連貫的推理與思考鏈。
真實世界程式碼處理能力: 在業界重視的處理真實世界軟體工程問題能力指標,也就是我們熟悉的 SWE-bench Verified 基準測試,Opus 4.1的得分率提升至 74.5%。它不僅能更準確地識別和修復程式碼錯誤,幫我們除錯的能力再提高外,也可以高效處理涉及多個文件的複雜程式碼重構任務,並能同時降低冗餘和錯誤的產生機率。

Picture Credit: Anthropic
精進的推理能力: Opus 4.1在邏輯推理和解決複雜問題方面也獲得了提升,比以往更了解我們對它下的指令,回應內容也更為精準。

Picture Credit: Anthropic
怎樣能夠體驗到 Claude Opus 4.1 AI 模型的功能呢?
現階段,只要是付費的 Claude 用戶、Claude Code 訂閱者,以及透過 API、Amazon Bedrock 和 Google Cloud Vertex AI 等平台使用服務的開發者,均可體驗 Claude Opus 的強大功能。以 API 定價來看,它的費用和上一代的 Opus 4 是一樣的,也沒有漲價。
此外,該模型也已在工程師的好幫手軟體 GitHub Copilot 中提供公開預覽,並預計在未來兩周內正式取代 Opus 4。
Opus 4.1 在處理複雜程式碼任務上的表現還算不錯,在工程師社群和論壇逐步被討論中,延續之前 Claude AI 在軟體開發領域的口碑 。
最後就是 Anthropic 這次還預告他們家未來會有更一步的大規模 AI 模型升級,這讓我們很期待它接下來的發展。
本文最上方的標題特色圖片,由 AI 所產生。