Anthropic 近期推出最新人工智慧模型 Claude Fable 5。根據官方資料,Fable 5 在生物與化學等專業領域的推理能力有明顯的提升,但也因此導入更嚴格的安全防護機制,以降低高風險知識被濫用的可能性,但是這項設定目前在實際使用中引發了社群諸多討論與負面評論。
生物與化學領域被列為高風險
根據官方說明,由於 Fable 5 在生物與化學方面的能力大幅增強,Anthropic 擔憂相關技術可能會被濫用於高風險生物研究。為防範潛在風險,目前多數涉及生物與化學的請求都會直接被系統自動降級轉由 Opus 4.8 處理。這機制導致許多看似普通的醫學與生物學問題皆面臨無法直接使用最新模型。根據社群的回饋包含癌症研究、mRNA 疫苗、粒線體甚至花粉症等日常醫學名詞,皆可能觸發系統封鎖。
心理學與一般開發工作遭受波及
在 Reddit 與 Hacker News 等開發者社群中,也出現了多起關於此系統過度敏感的回饋。部分使用者指出,Fable 5 不僅在資訊安全情境下容易觸發防護機制,連神經科學、心理學資料分析甚至一般的程式開發工作,都可能被系統標記並強制切回 Opus 4.8。心理學領域的處境尤為微妙。其實心理學並未被官方列為主要的封鎖範圍,但由於相關研究經常涉及神經科學、腦波、臨床心理、精神健康、行為干預以及受試者資料分析等詞彙,因此非常容易被安全分類器判定是生物醫療或歸類為高風險人類研究。社群平台上有開發者表示,他僅是撰寫心理學理論與文獻的資料分析程式,也同樣遭遇降級對待。
社群嘲諷過度敏感的防護機制
在 Reddit 的 ClaudeAI 看板上,甚至出現了一篇極具諷刺意味的討論,標題直指 Fable 5 的安全機制實在太安全了,它在嘗試讀取自己的技術報告時,竟然也立刻觸發防護並呼叫Opus 4.8來救援。不少使用者在下方留言附和,表示這項降級功能經常在一些令人匪夷所思的小事上觸發。儘管引發不少抱怨,但也有社群成員推測,Anthropic團隊應該會在接下來幾天內著手調整,以改善此類過度敏感的狀況。
引發限制協助開發其他語言模型的爭議
除了生物醫學與心理學領域,人工智慧開發社群也對 Fable 5 的限制提出質疑。在 LocalLLaMA看板中,有開發者發起討論,指出Anthropic似乎刻意限制Fable 5協助開發其他大型語言模型。此類討論的重點並非單純的資訊安全拒答,而是針對模型能力的針對性限制。許多留言批評此舉嚴重破壞了開發者的正常工作流程,更讓付費用戶被迫承擔功能受限的成本與不便。
保守防護機制挑戰專業工作者耐心
由上述社群實測的經驗分享來看,Fable 5 的安全機制並非僅在偵測到實際危險時才啟動攔截,而是只要內容看似涉及高風險相關領域,就可能觸發分類器,改由 Opus 4.8 處理。這樣的防護標準對一般大眾或許影響不大,但對於生物、醫學、心理、資訊安全以及人工智慧研究人員而言,這些敏感詞彙是他們正常工作環節中必須經常使用的,這樣的機制已對他們的日常工作造成影響。
Anthropic 表示未來調整防護降低誤判率
儘管 Anthropic 官方並未公布具體的觸發詞彙清單,但從官方說明與社群回饋來看,Fable 5 的防護主要集中在資訊安全、生物與化學等高風險領域。部分使用者回報,癌症研究、神經科學、心理學資料分析等正常研究情境,也可能因為內容接近生物醫學或人類研究主題,而被系統標記並強制切回 Opus 4.8。Anthropic 官方對此表示,Fable 5 目前的防護機制已足以支撐一般用途,但基於安全優先的考量,相關分類器被刻意設定得較為保守,甚至比理想狀態更為嚴格,因此部分正常請求也可能誤觸防護。Anthropic 表示未來在更新與調整防護機制時,會逐步降低誤判率。
首圖由 Nano Banana AI 生成








