← 全部文章
Compare

Claude Fable 5 vs Opus 4.8 Fast Mode:同樣 token 價格,不同取捨

A split comparison dashboard on cream paper: left column “Fable 5” with long-horizon agent loops and safeguard gates, ri

Anthropic 意外做出了 2026 年 6 月最乾淨俐落的模型選擇題:如果 Claude Fable 5 每百萬 input tokens 要價 10 美元、每百萬 output tokens 要價 50 美元,而 Opus 4.8 Fast Mode 也是 10/50 美元,那開發者到底該跑哪一個?

這不是紙上談兵的試算表練習。截至 6 月 19 日,Anthropic 自家的 Fable 頁面寫著「Claude Fable 5 目前無法使用」,並列出 $10/M input、$50/M output 的價格(Anthropic)。Claude 的價格頁面列出 Opus 4.8 為 $5/M input、$25/M output,接著說 Fast Mode 以標準價格 2 倍收費,提供「最高 2.5 倍更快速度」(Claude pricing)。算一下:Opus 4.8 Fast Mode 正好落在跟 Fable 5 一樣的 token 費率。

這讓決策更銳利。Fable 是野心更大的模型。Opus 4.8 Fast Mode 則是你在延遲很重要、存取不能靠運氣時,可以圍繞它設計系統的模型。

一張橫向價格/效能圖,比較 Fable 5、Opus 4.8 standard 與 Opus 4.8 Fast Mode;x 軸列出 outp

改變選擇的價格表

開發者應該從這張務實的表開始:

Model2026 年 6 月 19 日可用性InputOutputContext / output速度註記最適合
Claude Fable 5目前無法使用$10/MTok$50/MTok1M context,最高 128k output為長時間 agentic 工作打造困難、模糊、多階段專案
Claude Opus 4.8可用$5/MTok$25/MTok標準價格下 1M context標準速度複雜寫程式、企業 agent
Claude Opus 4.8 Fast ModeResearch preview / Claude Code 額外用量$10/MTok$50/MTok同 Opus 4.8 費率的 context 規則output 最高快 2.5 倍對延遲敏感的 agent 迴圈

Fable 規格來自 Anthropic 的 API 文件:Fable 5 預設有 1M-token context window,每次請求最高支援 128k output tokens,價格是 $10/$50(Claude API docs)。同一份文件也說,Fable 和 Mythos 永遠開啟 adaptive thinking,而且不支援 thinking: {"type": "disabled"}

最後這點很重要。Fable 不是單純「更聰明的 Opus」。它的運作輪廓不同:更自主、更會自我檢查,也常常跑得更久。Anthropic 形容它是為「有野心、長時間、非同步工作」打造,並說它可以在 agent harnesses 裡工作數天(Anthropic Fable page)。如果你的產品仰賴緊湊的互動回合,這正好是你不想要的東西。

當瓶頸是實際等待時間,Opus 4.8 Fast Mode 是更乾淨的替代品。Anthropic 的 Fast Mode 頁面說 Opus 4.8 Fast Mode 是高速配置,output token 速度快 2.5 倍,且具備「相同的 Opus-level model intelligence」(Claude Fast Mode)。API 價格文件列出 Fast Mode Opus 4.8 為 $10/M input、$50/M output(Claude API pricing)。

同樣 token 價格。不同賭注。

社群真正吵的是什麼

Fable 發表時的 Hacker News 討論,重點比較不是「它聰不聰明?」而是開發者到底想從一個會主動採取行動的模型身上要多少 agency。那串發表討論值得一讀,因為它把核心拉扯講得很清楚:當模型修掉你忘記的東西,主動性像魔法;當它沒經允許就擴大範圍,主動性就顯得昂貴或危險(Hacker News)。

Reddit 則更務實。一篇 r/ClaudeAI benchmark 文章跑了 200 個 headless claude -p sessions,回報 Fable 5 在原始使用上看起來比 Opus 4.8 貴 2–3 倍,即使標價剛好是 2 倍。同篇文章還得到一個有點意外的 steering 結果:Opus 4.6 在它的指令遵循量測中拿到 88/90,Fable 5 拿到 83/90,Opus 4.8 拿到 80/90(Reddit)。把它當成某個使用者的 harness,不是放諸四海皆準的 benchmark;但這個型態符合很多 agent builders 看到的現象:成本不只是價目表。成本也包含 output 長度、重試、工具呼叫,以及模型會不會過度規劃。

另一篇橫跨 917 個 coding-agent 場景的 Reddit 比較,回報 Fable 5 總分 92.9、每個任務約 $1.25;Opus 4.8 則是 92.0、每個任務約 $0.74。也就是在那個 benchmark 裡,為了 0.9 分提升付出約 73% 的任務成本溢價(Reddit)。有用的不是精確分數。有用的是取捨的形狀:Fable 可能在難題上勝出,但這個溢價只有在那些任務真的會在 Opus 上失敗、或需要太多回合時,才回本。

還有一條很實際的營運挫折線。Fable 在 6 月 9 日推出,接著 Anthropic 在 6 月 12 日表示,由於美國政府的出口管制指令,暫停 Fable 5 和 Mythos 5 的存取(Anthropic statement)。這就是為什麼如果你這週要出貨一個 coding agent,「等 Fable 就好」不是計畫。

一張模型家族圖,底部是 Sonnet 和 Haiku,上方是 Opus 4.8,Opus 4.8 Fast Mode 作為速度最佳化

當延遲就是產品時,用 Opus 4.8 Fast Mode

如果你在做 IDE agent、CI 修復 bot、瀏覽器自動化工具,或即時 code-review assistant,延遲不是虛榮指標。它會改變使用者行為。

慢 agent 會讓開發者批次丟需求、切去別的分頁,或不再相信這個迴圈。更快的 agent 可以要求確認、跑測試、修檔案、串流進度,而不會讓整個 session 像死掉。對這些工作流來說,在 Fable 等價 token 價格下,Opus 4.8 Fast Mode 是更好的預設。

在以下情境使用 Opus 4.8 Fast Mode:

  1. 任務是互動式的。例如:「修這個 failing test」、「解釋這個 stack trace」、「編輯這個 component」、「產生 migration 並執行」。
  2. 你已經有好的 harness。如果你的 agent 有 repo search、test execution、patch review 和 rollback,你可能更需要更快的回合,而不是更自主的 base model。
  3. 你需要可預測的 routing。Fable 的安全分類器可能拒絕某些請求,而 Anthropic 表示,被標記的 cybersecurity、biology、chemistry 或 distillation 請求可能會從 Fable 轉 route 到 Opus 4.8(Anthropic launch post)。這是合理的安全設計,但也是 production path 裡又一個分支。
  4. 你的 agent 有面向使用者的進度期限。Fast Mode 明確承諾的是速度。Fable 承諾的是野心。

Opus 4.8 Fast Mode 的殺手級用途,是 agent inner loop:

claude -p "Run the failing test, patch the smallest fix, rerun only that test, and summarize the diff."

這個工作不需要好幾天的自主性。它需要快速讀取、編輯、測試、回報。在這裡用 Fable 的價格買 output 更快的 Opus,很合理。

當難點是 steering 而不是速度時,用 Fable 5

Fable 仍然是我會想拿來處理那些塞不進 90 秒 coding 回合的混亂專案的模型。Anthropic 說 Fable 的領先會隨著任務更長、更複雜而擴大,並描述它在軟體工程、知識工作、vision、memory 和科學研究上的強項(Anthropic launch post)。它的文件也說,這是為高要求推理與 long-horizon agentic work 打造的模型(Claude API docs)。

在以下情境使用 Fable 5:

  1. 你可以非同步執行。把工作排進佇列、串流狀態,讓它做事。
  2. 任務拆解不清楚。例如:大型 migration、多 repo refactor、從設計到實作、benchmark 調查、研究綜整。
  3. 你希望模型驗證自己的工作。Fable 的定位更像「senior agent」,不是「fast assistant」。
  4. 更少回合比更快回合更值錢。如果 Fable 省掉三輪人類 steering,那跟 Opus Fast 一樣的 $10/$50 token 費率就可能變便宜。

問題是存取權限。Anthropic 目前的公開頁面說 Fable 無法使用。乾淨的 fallback 架構,是把 Fable 做成選配的頂級 route,而不是唯一 route:

interactive task -> Opus 4.8 Fast Mode
routine batch task -> Opus 4.8 standard or Sonnet
hard async task -> Fable 5 when available
flagged / refused Fable request -> Opus 4.8 fallback

這也是 OneHop 很自然能放進來的位置。如果你的阻礙是不想重建 provider layer 就試 Fable,OneHop 把 anthropic/claude-fable-5 列為 model endpoint,標示為暫時無法使用,並顯示新帳號免信用卡可拿 $10 free credit(OneHop)。我查看的頁面列出 Anthropic Messages 支援位於 https://api.onehop.ai/anthropic,並顯示相對官方 $10/$50 標價的折扣價格。

from anthropic import Anthropic

client = Anthropic(
    base_url="https://api.onehop.ai/anthropic",
    api_key="<ONEHOP_KEY>",
)

message = client.messages.create(
    model="anthropic/claude-fable-5",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Plan a safe, staged migration from Jest to Vitest."}],
)

print(message.content[0].text)

如果你的整合是 OpenAI-compatible,且你的 OneHop 帳號已設定使用 /v1 gateway,遷移模式是同一個概念:把 base URL 改成 https://api.onehop.ai/v1,把 model routing 留在商業邏輯之外,並透過 config 交換 model IDs。針對 Fable,部署前請先在即時 OneHop model page 上確認支援的 protocol。

一張 coding-agent router 的架構流程草圖:user request 進入 classifier,分支到 Opus 4.8 Fast Mode f

建議

不要把 Opus 4.8 全面替換成 Fable 5。那是昂貴又脆弱的遷移版本。

對延遲敏感的 coding agents,使用 Opus 4.8 Fast Mode 作為 Fable 價格級距的替代品。它有相同 token 價格、速度承諾講得很明白,也避免依賴一個目前無法使用的模型。等存取恢復後,再把 Fable 5 加成非同步升級路徑。

對長時間自主工作,等 Fable 存取恢復,或等它上線後透過 provider route 測試它。Fable 的理由不是「跟 Opus Fast 同價」。Fable 的理由是「在 Opus 仍難以完成的工作上,少幾輪 steering」。如果你的任務已經能被 Opus 4.8 解掉,Fast Mode 買到的是更好的使用者體驗。如果你的任務失敗是因為模型撐不住整個計畫,Fable 才是值得付錢的那個。

我的預設 routing 規則很簡單:

  • 即時 coding loops 用 Opus 4.8 Fast Mode 出貨。
  • 成本受控的背景工作保留 Opus 4.8 standard。
  • 只有最困難的 async tasks,在 Fable 5 可用時 route 過去。
  • 衡量 task cost,不要只看 token price。

如果你想用低摩擦方式測這套路由,從 Claude Fable 5 on OneHop 開始,然後領取 $10 free。重點不是崇拜 frontier model。重點是停止把 model choices 寫死在你的 agent 裡,並把取捨攤開來。