← 全部文章
News

Claude Fable 5 使用分類器,將部分網路安全、生物與蒸餾請求導向 Opus 4.8

A cream-background editorial diagram showing Claude Fable 5 as a central routing node, with three terracotta classifier

Claude Fable 5 已於 2026 年 6 月 9 日正式全面開放,但它不會回答你丟給它的每一個請求。Anthropic 表示,部分被新防護機制標記為涉及網路安全、生物與化學,或蒸餾的請求,會改由 Claude Opus 4.8 自動處理;早期資料也顯示,超過 95% 的 Fable 工作階段完全不會觸發 fallback(Anthropic)。

這個實作細節,比發表新聞標題更重要。如果你在除錯 agent、跑 eval,或比較模型品質,「我呼叫了 Fable 5」已經不一定等於「Fable 5 回答了」。有時候,產品介面,或你設定後的 API 整合,會把請求導向 Opus 4.8。

一張與封面風格一致的模型家族示意圖,顯示 Fable 5 與 Mythos 5 共用同一個底層模型區塊,並標出 Fable p

Anthropic 實際推出了什麼

Anthropic 在 6 月 9 日推出兩個相關模型:Claude Fable 5 與 Claude Mythos 5。Fable 5 是正式全面開放的版本。Mythos 5 則受限使用,初期開放給 Project Glasswing 夥伴,之後再給部分可信存取計畫使用(Anthropic)。

Anthropic 把 Fable 5 描述為一個已調整到可供一般使用的「Mythos-class」模型。它的產品頁把它定位在長時間執行的程式開發、agentic 工作、企業流程,以及高度依賴視覺的文件任務(Anthropic)。API 文件則把 claude-fable-5 列為 Anthropic 最強、且已廣泛發布的模型,具備 1M token context window、128k max output、adaptive thinking 永遠開啟,定價為每百萬 input tokens 10 美元、每百萬 output tokens 50 美元(Claude API docs)。

開發者需要掌握的模型概況很簡單:

ModelAPI IDAvailabilityContextMax outputPrice per 1M tokens
Claude Fable 5claude-fable-5全面開放1M128k$10 input / $50 output
Claude Mythos 5claude-mythos-5有限開放,Project Glasswing 與可信存取1M128k$10 input / $50 output
Claude Opus 4.8claude-opus-4-8全面開放Claude API、Bedrock、Vertex AI 上為 1M128k$5 input / $25 output

重點差異不只是能力,而是政策介面。Fable 5 是加上額外防護的公開模型。根據 Anthropic 的發布文章,Mythos 5 則是同一個底層模型,但對核准使用者解除部分防護(Anthropic)。

Fallback 路徑

Anthropic 表示,Fable 5 使用一組新的分類器,也就是獨立的 AI 系統,用來偵測潛在濫用與 jailbreak 嘗試。當這些分類器偵測到請求與網路安全、生物與化學,或蒸餾有關時,回應會自動改由 Claude Opus 4.8 處理(Anthropic)。

Help Center 則用更產品層級的方式描述同一個行為。Fable 5 會對每個請求執行自動安全檢查。這些檢查旨在阻擋的範圍包括攻擊性網路安全技術、生物與生命科學查詢、摘要式思考內容的擷取,以及一小部分前沿 LLM 開發任務,例如分散式訓練基礎設施,以及部分加速器或 kernel 工作(Claude Help Center)。

該頁面也說,檢查看的不只是最新一則訊息。Memory、connector 內容、網頁結果與檔案都可能觸發封鎖。這是除錯陷阱。使用者可能只是問一個無害的追問,但對話中先前貼過的漏洞利用說明、實驗室流程,或模型訓練筆記,都可能讓分類器響起警報。

在 Claude 的消費者與工作區介面上,選擇 Fable 5 時,自動切換預設為開啟。如果某一輪被切換,使用者會看到通知,回答也會標示實際回應的模型。切換後,該對話剩下的部分,模型選擇器會停留在 Opus 4.8,除非使用者手動切回來(Claude Help Center)。

一張由左到右的請求流程草圖:使用者提示與檔案進入 Fable 5 分類器檢查,安全請求前往 Fable r

開發者為什麼會有感

Fallback 會製造出一種新的「模型行為」bug。

第一,eval 可能變成混合模型 eval。如果你的測試集包含漏洞分析、安全強化、合成生物學、化學、醫學研究,或模型蒸餾 prompts,有些資料列可能會由 Opus 4.8 回答。如果你的 harness 只記錄被請求的模型,你會把結果歸因錯。

第二,agent traces 可能看起來前後不一致。Fable 5 可能負責規劃、程式碼修改與重構,接著 Opus 4.8 可能回答某個被標記的安全審查回合。如果 agent 使用 subagents,每一次 subagent 呼叫都需要在 API 裡有自己的 fallback 設定。Anthropic 的 cookbook 警告,API fallback 沒有帳號層級或工作階段層級的開關。每個請求都必須包含 fallback 設定(Claude Cookbook)。

第三,計費需要更細的觀測。Anthropic 的 Help Center 表示,如果請求在 Fable 產生輸出前就被封鎖,只會按 Opus 費率計費。如果請求在串流中途被封鎖,input 與已經串流出去的 tokens 會按 Fable 費率計費,剩下的部分則按 Opus 費率計費(Claude Help Center)。

對 API 使用者來說,伺服器端 fallback 路徑長這樣:

curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: server-side-fallback-2026-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-fable-5",
    "max_tokens": 1024,
    "fallbacks": [{ "model": "claude-opus-4-8" }],
    "messages": [{ "role": "user", "content": "Hello, world" }]
  }'

真正的生產建議是:同時記錄 requested_modelresponse_model。也要記錄 stop reasons、可取得時的 fallback categories、回應是否為串流,以及請求是否由 subagent 或 retry path 建立。

安全敏感工作流程需要獨立 Eval

Fable 5 可能很適合作為長期程式開發與知識工作的預設選項。但凡是提到安全、生物、化學、醫療保健,或模型訓練的工作流程,它不會自動就是正確預設。

Anthropic 明確表示,這些防護偏保守,可能會攔到無害請求。發布文章說,公司是為了「既安全又快速」發布模型而這樣調整,也預期會出現 false positives,Anthropic 會繼續縮小範圍(Anthropic)。Help Center 則列出可能被封鎖的合法工作範例,包括授權安全測試、良性生物研究、生技商業文件、醫學影像與診斷、臨床問題,以及基礎生物教育(Claude Help Center)。

這表示你的 eval suite 至少應該分成三個桶:

  1. Fable 應該直接回答的一般產品流量。
  2. 預期且可接受 fallback 的雙用途或敏感流量。
  3. 請求本身良性、但可能碰到分類器邊界的 false-positive probes。

不要把這些平均在一起,然後稱之為「Fable 5 品質」。針對每個桶,追蹤回答品質、fallback rate、latency、refusal rate、成本與使用者可見訊息。如果你替生技客戶跑客服 bot,3% fallback rate 可能很正常。如果你跑的是前端遷移用的 coding assistant,3% 可能代表你的 prompt templates 不小心把安全或模型擷取語言拖進了 context。

一張精簡的評估儀表板 mockup,有三欄分別標示一般流量、敏感流量與 false-positive p

資料保留變更也是故事的一部分

Fable 5 也為部分商業客戶帶來資料保留政策變更。Anthropic 表示,從 2026 年 6 月 9 日起,在所有提供 Mythos-class models 的平台上,Mythos-class models 的 prompts 與 outputs 都會為信任與安全目的保留 30 天(Claude Help Center)。

這對先前使用 zero data retention 的組織影響最大。Anthropic 表示,這項變更適用於 Claude Console 中的 ZDR workspaces、Claude Enterprise 中使用 ZDR 的 Claude Code,以及透過 AWS Bedrock、Google Cloud Agent Platform 或 Microsoft Foundry 且採用 ZDR 的存取。其他模型不受這項特定政策影響(Claude Help Center)。

對開發者來說,這會變成架構問題,而不是法律註腳。你可能需要另一個工作區、sandbox org,或 provider-specific retention configuration,Fable 5 才能進入生產路徑。如果你的資料分類規則禁止 30 天保留,在安全與法務團隊核准設定前,就先用其他模型。

什麼時候 Fable 5 是對的模型

當任務受益於持續性、長 context 與高自主性時,就用 Fable 5:大型遷移、多步驟重構、複雜文件推理、高度依賴視覺的分析,或需要自行規劃與測試工作的 agents。Anthropic 自己的定位指向「days-long」與非同步任務,而不是便宜的大量 completions(Anthropic)。

當任務貼近分類器邊界時,就要更小心。安全 copilots、生物研究 assistants、化學搜尋工具、模型訓練平台與 eval harnesses 都應該把 fallback 視為預期狀態。把 UI 與 logs 做到讓使用者能看出是哪個模型回答。把測試做到 regression 會顯示為「fallback rate changed」,而不是神祕的品質漂移。

這次發布仍然是大事。Anthropic 讓一個 Mythos-class model 全面開放,並提供公開定價、API 存取與文件化的 fallback 路徑。但對開發者來說,營運上的結論很簡單:Fable 5 是一個 routed system。如果你把它當成單一靜態模型上線,你的 traces、evals 與帳單最後一定會和現實對不上。

如果你想自己試試 Claude Fable 5,可以透過 drop-in endpoint 使用 OneHop 上的 Claude Fable 5,價格大約比定價低 30%。新帳號可以從免費 10 美元開始,不需要信用卡。

延伸閱讀:Claude Fable 5 入門.