Anthropic 意外做出了 2026 年 6 月最乾淨俐落的模型選擇題:如果 Claude Fable 5 每百萬 input tokens 要價 10 美元、每百萬 output tokens 要價 50 美元,而 Opus 4.8 Fast Mode 也是 10/50 美元,那開發者到底該跑哪一個?
這不是紙上談兵的試算表練習。截至 6 月 19 日,Anthropic 自家的 Fable 頁面寫著「Claude Fable 5 目前無法使用」,並列出 $10/M input、$50/M output 的價格(Anthropic)。Claude 的價格頁面列出 Opus 4.8 為 $5/M input、$25/M output,接著說 Fast Mode 以標準價格 2 倍收費,提供「最高 2.5 倍更快速度」(Claude pricing)。算一下:Opus 4.8 Fast Mode 正好落在跟 Fable 5 一樣的 token 費率。
這讓決策更銳利。Fable 是野心更大的模型。Opus 4.8 Fast Mode 則是你在延遲很重要、存取不能靠運氣時,可以圍繞它設計系統的模型。

改變選擇的價格表
開發者應該從這張務實的表開始:
| Model | 2026 年 6 月 19 日可用性 | Input | Output | Context / output | 速度註記 | 最適合 |
|---|---|---|---|---|---|---|
| Claude Fable 5 | 目前無法使用 | $10/MTok | $50/MTok | 1M context,最高 128k output | 為長時間 agentic 工作打造 | 困難、模糊、多階段專案 |
| Claude Opus 4.8 | 可用 | $5/MTok | $25/MTok | 標準價格下 1M context | 標準速度 | 複雜寫程式、企業 agent |
| Claude Opus 4.8 Fast Mode | Research preview / Claude Code 額外用量 | $10/MTok | $50/MTok | 同 Opus 4.8 費率的 context 規則 | output 最高快 2.5 倍 | 對延遲敏感的 agent 迴圈 |
Fable 規格來自 Anthropic 的 API 文件:Fable 5 預設有 1M-token context window,每次請求最高支援 128k output tokens,價格是 $10/$50(Claude API docs)。同一份文件也說,Fable 和 Mythos 永遠開啟 adaptive thinking,而且不支援 thinking: {"type": "disabled"}。
最後這點很重要。Fable 不是單純「更聰明的 Opus」。它的運作輪廓不同:更自主、更會自我檢查,也常常跑得更久。Anthropic 形容它是為「有野心、長時間、非同步工作」打造,並說它可以在 agent harnesses 裡工作數天(Anthropic Fable page)。如果你的產品仰賴緊湊的互動回合,這正好是你不想要的東西。
當瓶頸是實際等待時間,Opus 4.8 Fast Mode 是更乾淨的替代品。Anthropic 的 Fast Mode 頁面說 Opus 4.8 Fast Mode 是高速配置,output token 速度快 2.5 倍,且具備「相同的 Opus-level model intelligence」(Claude Fast Mode)。API 價格文件列出 Fast Mode Opus 4.8 為 $10/M input、$50/M output(Claude API pricing)。
同樣 token 價格。不同賭注。
社群真正吵的是什麼
Fable 發表時的 Hacker News 討論,重點比較不是「它聰不聰明?」而是開發者到底想從一個會主動採取行動的模型身上要多少 agency。那串發表討論值得一讀,因為它把核心拉扯講得很清楚:當模型修掉你忘記的東西,主動性像魔法;當它沒經允許就擴大範圍,主動性就顯得昂貴或危險(Hacker News)。
Reddit 則更務實。一篇 r/ClaudeAI benchmark 文章跑了 200 個 headless claude -p sessions,回報 Fable 5 在原始使用上看起來比 Opus 4.8 貴 2–3 倍,即使標價剛好是 2 倍。同篇文章還得到一個有點意外的 steering 結果:Opus 4.6 在它的指令遵循量測中拿到 88/90,Fable 5 拿到 83/90,Opus 4.8 拿到 80/90(Reddit)。把它當成某個使用者的 harness,不是放諸四海皆準的 benchmark;但這個型態符合很多 agent builders 看到的現象:成本不只是價目表。成本也包含 output 長度、重試、工具呼叫,以及模型會不會過度規劃。
另一篇橫跨 917 個 coding-agent 場景的 Reddit 比較,回報 Fable 5 總分 92.9、每個任務約 $1.25;Opus 4.8 則是 92.0、每個任務約 $0.74。也就是在那個 benchmark 裡,為了 0.9 分提升付出約 73% 的任務成本溢價(Reddit)。有用的不是精確分數。有用的是取捨的形狀:Fable 可能在難題上勝出,但這個溢價只有在那些任務真的會在 Opus 上失敗、或需要太多回合時,才回本。
還有一條很實際的營運挫折線。Fable 在 6 月 9 日推出,接著 Anthropic 在 6 月 12 日表示,由於美國政府的出口管制指令,暫停 Fable 5 和 Mythos 5 的存取(Anthropic statement)。這就是為什麼如果你這週要出貨一個 coding agent,「等 Fable 就好」不是計畫。

當延遲就是產品時,用 Opus 4.8 Fast Mode
如果你在做 IDE agent、CI 修復 bot、瀏覽器自動化工具,或即時 code-review assistant,延遲不是虛榮指標。它會改變使用者行為。
慢 agent 會讓開發者批次丟需求、切去別的分頁,或不再相信這個迴圈。更快的 agent 可以要求確認、跑測試、修檔案、串流進度,而不會讓整個 session 像死掉。對這些工作流來說,在 Fable 等價 token 價格下,Opus 4.8 Fast Mode 是更好的預設。
在以下情境使用 Opus 4.8 Fast Mode:
- 任務是互動式的。例如:「修這個 failing test」、「解釋這個 stack trace」、「編輯這個 component」、「產生 migration 並執行」。
- 你已經有好的 harness。如果你的 agent 有 repo search、test execution、patch review 和 rollback,你可能更需要更快的回合,而不是更自主的 base model。
- 你需要可預測的 routing。Fable 的安全分類器可能拒絕某些請求,而 Anthropic 表示,被標記的 cybersecurity、biology、chemistry 或 distillation 請求可能會從 Fable 轉 route 到 Opus 4.8(Anthropic launch post)。這是合理的安全設計,但也是 production path 裡又一個分支。
- 你的 agent 有面向使用者的進度期限。Fast Mode 明確承諾的是速度。Fable 承諾的是野心。
Opus 4.8 Fast Mode 的殺手級用途,是 agent inner loop:
claude -p "Run the failing test, patch the smallest fix, rerun only that test, and summarize the diff."
這個工作不需要好幾天的自主性。它需要快速讀取、編輯、測試、回報。在這裡用 Fable 的價格買 output 更快的 Opus,很合理。
當難點是 steering 而不是速度時,用 Fable 5
Fable 仍然是我會想拿來處理那些塞不進 90 秒 coding 回合的混亂專案的模型。Anthropic 說 Fable 的領先會隨著任務更長、更複雜而擴大,並描述它在軟體工程、知識工作、vision、memory 和科學研究上的強項(Anthropic launch post)。它的文件也說,這是為高要求推理與 long-horizon agentic work 打造的模型(Claude API docs)。
在以下情境使用 Fable 5:
- 你可以非同步執行。把工作排進佇列、串流狀態,讓它做事。
- 任務拆解不清楚。例如:大型 migration、多 repo refactor、從設計到實作、benchmark 調查、研究綜整。
- 你希望模型驗證自己的工作。Fable 的定位更像「senior agent」,不是「fast assistant」。
- 更少回合比更快回合更值錢。如果 Fable 省掉三輪人類 steering,那跟 Opus Fast 一樣的 $10/$50 token 費率就可能變便宜。
問題是存取權限。Anthropic 目前的公開頁面說 Fable 無法使用。乾淨的 fallback 架構,是把 Fable 做成選配的頂級 route,而不是唯一 route:
interactive task -> Opus 4.8 Fast Mode
routine batch task -> Opus 4.8 standard or Sonnet
hard async task -> Fable 5 when available
flagged / refused Fable request -> Opus 4.8 fallback
這也是 OneHop 很自然能放進來的位置。如果你的阻礙是不想重建 provider layer 就試 Fable,OneHop 把 anthropic/claude-fable-5 列為 model endpoint,標示為暫時無法使用,並顯示新帳號免信用卡可拿 $10 free credit(OneHop)。我查看的頁面列出 Anthropic Messages 支援位於 https://api.onehop.ai/anthropic,並顯示相對官方 $10/$50 標價的折扣價格。
from anthropic import Anthropic
client = Anthropic(
base_url="https://api.onehop.ai/anthropic",
api_key="<ONEHOP_KEY>",
)
message = client.messages.create(
model="anthropic/claude-fable-5",
max_tokens=1024,
messages=[{"role": "user", "content": "Plan a safe, staged migration from Jest to Vitest."}],
)
print(message.content[0].text)
如果你的整合是 OpenAI-compatible,且你的 OneHop 帳號已設定使用 /v1 gateway,遷移模式是同一個概念:把 base URL 改成 https://api.onehop.ai/v1,把 model routing 留在商業邏輯之外,並透過 config 交換 model IDs。針對 Fable,部署前請先在即時 OneHop model page 上確認支援的 protocol。

建議
不要把 Opus 4.8 全面替換成 Fable 5。那是昂貴又脆弱的遷移版本。
對延遲敏感的 coding agents,使用 Opus 4.8 Fast Mode 作為 Fable 價格級距的替代品。它有相同 token 價格、速度承諾講得很明白,也避免依賴一個目前無法使用的模型。等存取恢復後,再把 Fable 5 加成非同步升級路徑。
對長時間自主工作,等 Fable 存取恢復,或等它上線後透過 provider route 測試它。Fable 的理由不是「跟 Opus Fast 同價」。Fable 的理由是「在 Opus 仍難以完成的工作上,少幾輪 steering」。如果你的任務已經能被 Opus 4.8 解掉,Fast Mode 買到的是更好的使用者體驗。如果你的任務失敗是因為模型撐不住整個計畫,Fable 才是值得付錢的那個。
我的預設 routing 規則很簡單:
- 即時 coding loops 用 Opus 4.8 Fast Mode 出貨。
- 成本受控的背景工作保留 Opus 4.8 standard。
- 只有最困難的 async tasks,在 Fable 5 可用時 route 過去。
- 衡量 task cost,不要只看 token price。
如果你想用低摩擦方式測這套路由,從 Claude Fable 5 on OneHop 開始,然後領取 $10 free。重點不是崇拜 frontier model。重點是停止把 model choices 寫死在你的 agent 裡,並把取捨攤開來。