Claude Fable 5 vs Opus 4.8 Fast Mode：同樣 token 價格，不同取捨

Anthropic 意外做出了 2026 年 6 月最乾淨俐落的模型選擇題：如果 Claude Fable 5 每百萬 input tokens 要價 10 美元、每百萬 output tokens 要價 50 美元，而 Opus 4.8 Fast Mode 也是 10/50 美元，那開發者到底該跑哪一個？

這不是紙上談兵的試算表練習。截至 6 月 19 日，Anthropic 自家的 Fable 頁面寫著「Claude Fable 5 目前無法使用」，並列出 $10/M input、$50/M output 的價格（Anthropic）。Claude 的價格頁面列出 Opus 4.8 為 $5/M input、$25/M output，接著說 Fast Mode 以標準價格 2 倍收費，提供「最高 2.5 倍更快速度」（Claude pricing）。算一下：Opus 4.8 Fast Mode 正好落在跟 Fable 5 一樣的 token 費率。

這讓決策更銳利。Fable 是野心更大的模型。Opus 4.8 Fast Mode 則是你在延遲很重要、存取不能靠運氣時，可以圍繞它設計系統的模型。

一張橫向價格／效能圖，比較 Fable 5、Opus 4.8 standard 與 Opus 4.8 Fast Mode；x 軸列出 outp

改變選擇的價格表

開發者應該從這張務實的表開始：

Model	2026 年 6 月 19 日可用性	Input	Output	Context / output	速度註記	最適合
Claude Fable 5	目前無法使用	$10/MTok	$50/MTok	1M context，最高 128k output	為長時間 agentic 工作打造	困難、模糊、多階段專案
Claude Opus 4.8	可用	$5/MTok	$25/MTok	標準價格下 1M context	標準速度	複雜寫程式、企業 agent
Claude Opus 4.8 Fast Mode	Research preview / Claude Code 額外用量	$10/MTok	$50/MTok	同 Opus 4.8 費率的 context 規則	output 最高快 2.5 倍	對延遲敏感的 agent 迴圈

Fable 規格來自 Anthropic 的 API 文件：Fable 5 預設有 1M-token context window，每次請求最高支援 128k output tokens，價格是 $10/$50（Claude API docs）。同一份文件也說，Fable 和 Mythos 永遠開啟 adaptive thinking，而且不支援 thinking: {"type": "disabled"}。

最後這點很重要。Fable 不是單純「更聰明的 Opus」。它的運作輪廓不同：更自主、更會自我檢查，也常常跑得更久。Anthropic 形容它是為「有野心、長時間、非同步工作」打造，並說它可以在 agent harnesses 裡工作數天（Anthropic Fable page）。如果你的產品仰賴緊湊的互動回合，這正好是你不想要的東西。

當瓶頸是實際等待時間，Opus 4.8 Fast Mode 是更乾淨的替代品。Anthropic 的 Fast Mode 頁面說 Opus 4.8 Fast Mode 是高速配置，output token 速度快 2.5 倍，且具備「相同的 Opus-level model intelligence」（Claude Fast Mode）。API 價格文件列出 Fast Mode Opus 4.8 為 $10/M input、$50/M output（Claude API pricing）。

同樣 token 價格。不同賭注。

社群真正吵的是什麼

Fable 發表時的 Hacker News 討論，重點比較不是「它聰不聰明？」而是開發者到底想從一個會主動採取行動的模型身上要多少 agency。那串發表討論值得一讀，因為它把核心拉扯講得很清楚：當模型修掉你忘記的東西，主動性像魔法；當它沒經允許就擴大範圍，主動性就顯得昂貴或危險（Hacker News）。

Reddit 則更務實。一篇 r/ClaudeAI benchmark 文章跑了 200 個 headless claude -p sessions，回報 Fable 5 在原始使用上看起來比 Opus 4.8 貴 2–3 倍，即使標價剛好是 2 倍。同篇文章還得到一個有點意外的 steering 結果：Opus 4.6 在它的指令遵循量測中拿到 88/90，Fable 5 拿到 83/90，Opus 4.8 拿到 80/90（Reddit）。把它當成某個使用者的 harness，不是放諸四海皆準的 benchmark；但這個型態符合很多 agent builders 看到的現象：成本不只是價目表。成本也包含 output 長度、重試、工具呼叫，以及模型會不會過度規劃。

另一篇橫跨 917 個 coding-agent 場景的 Reddit 比較，回報 Fable 5 總分 92.9、每個任務約 $1.25；Opus 4.8 則是 92.0、每個任務約 $0.74。也就是在那個 benchmark 裡，為了 0.9 分提升付出約 73% 的任務成本溢價（Reddit）。有用的不是精確分數。有用的是取捨的形狀：Fable 可能在難題上勝出，但這個溢價只有在那些任務真的會在 Opus 上失敗、或需要太多回合時，才回本。

還有一條很實際的營運挫折線。Fable 在 6 月 9 日推出，接著 Anthropic 在 6 月 12 日表示，由於美國政府的出口管制指令，暫停 Fable 5 和 Mythos 5 的存取（Anthropic statement）。這就是為什麼如果你這週要出貨一個 coding agent，「等 Fable 就好」不是計畫。

一張模型家族圖，底部是 Sonnet 和 Haiku，上方是 Opus 4.8，Opus 4.8 Fast Mode 作為速度最佳化

當延遲就是產品時，用 Opus 4.8 Fast Mode

如果你在做 IDE agent、CI 修復 bot、瀏覽器自動化工具，或即時 code-review assistant，延遲不是虛榮指標。它會改變使用者行為。

慢 agent 會讓開發者批次丟需求、切去別的分頁，或不再相信這個迴圈。更快的 agent 可以要求確認、跑測試、修檔案、串流進度，而不會讓整個 session 像死掉。對這些工作流來說，在 Fable 等價 token 價格下，Opus 4.8 Fast Mode 是更好的預設。

在以下情境使用 Opus 4.8 Fast Mode：

任務是互動式的。例如：「修這個 failing test」、「解釋這個 stack trace」、「編輯這個 component」、「產生 migration 並執行」。
你已經有好的 harness。如果你的 agent 有 repo search、test execution、patch review 和 rollback，你可能更需要更快的回合，而不是更自主的 base model。
你需要可預測的 routing。Fable 的安全分類器可能拒絕某些請求，而 Anthropic 表示，被標記的 cybersecurity、biology、chemistry 或 distillation 請求可能會從 Fable 轉 route 到 Opus 4.8（Anthropic launch post）。這是合理的安全設計，但也是 production path 裡又一個分支。
你的 agent 有面向使用者的進度期限。Fast Mode 明確承諾的是速度。Fable 承諾的是野心。

Opus 4.8 Fast Mode 的殺手級用途，是 agent inner loop：

claude -p "Run the failing test, patch the smallest fix, rerun only that test, and summarize the diff."

這個工作不需要好幾天的自主性。它需要快速讀取、編輯、測試、回報。在這裡用 Fable 的價格買 output 更快的 Opus，很合理。

當難點是 steering 而不是速度時，用 Fable 5

Fable 仍然是我會想拿來處理那些塞不進 90 秒 coding 回合的混亂專案的模型。Anthropic 說 Fable 的領先會隨著任務更長、更複雜而擴大，並描述它在軟體工程、知識工作、vision、memory 和科學研究上的強項（Anthropic launch post）。它的文件也說，這是為高要求推理與 long-horizon agentic work 打造的模型（Claude API docs）。

在以下情境使用 Fable 5：

你可以非同步執行。把工作排進佇列、串流狀態，讓它做事。
任務拆解不清楚。例如：大型 migration、多 repo refactor、從設計到實作、benchmark 調查、研究綜整。
你希望模型驗證自己的工作。Fable 的定位更像「senior agent」，不是「fast assistant」。
更少回合比更快回合更值錢。如果 Fable 省掉三輪人類 steering，那跟 Opus Fast 一樣的 $10/$50 token 費率就可能變便宜。

問題是存取權限。Anthropic 目前的公開頁面說 Fable 無法使用。乾淨的 fallback 架構，是把 Fable 做成選配的頂級 route，而不是唯一 route：

interactive task -> Opus 4.8 Fast Mode
routine batch task -> Opus 4.8 standard or Sonnet
hard async task -> Fable 5 when available
flagged / refused Fable request -> Opus 4.8 fallback

這也是 OneHop 很自然能放進來的位置。如果你的阻礙是不想重建 provider layer 就試 Fable，OneHop 把 anthropic/claude-fable-5 列為 model endpoint，標示為暫時無法使用，並顯示新帳號免信用卡可拿 $10 free credit（OneHop）。我查看的頁面列出 Anthropic Messages 支援位於 https://api.onehop.ai/anthropic，並顯示相對官方 $10/$50 標價的折扣價格。

from anthropic import Anthropic

client = Anthropic(
    base_url="https://api.onehop.ai/anthropic",
    api_key="<ONEHOP_KEY>",
)

message = client.messages.create(
    model="anthropic/claude-fable-5",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Plan a safe, staged migration from Jest to Vitest."}],
)

print(message.content[0].text)

如果你的整合是 OpenAI-compatible，且你的 OneHop 帳號已設定使用 /v1 gateway，遷移模式是同一個概念：把 base URL 改成 https://api.onehop.ai/v1，把 model routing 留在商業邏輯之外，並透過 config 交換 model IDs。針對 Fable，部署前請先在即時 OneHop model page 上確認支援的 protocol。

一張 coding-agent router 的架構流程草圖：user request 進入 classifier，分支到 Opus 4.8 Fast Mode f

建議

不要把 Opus 4.8 全面替換成 Fable 5。那是昂貴又脆弱的遷移版本。

對延遲敏感的 coding agents，使用 Opus 4.8 Fast Mode 作為 Fable 價格級距的替代品。它有相同 token 價格、速度承諾講得很明白，也避免依賴一個目前無法使用的模型。等存取恢復後，再把 Fable 5 加成非同步升級路徑。

對長時間自主工作，等 Fable 存取恢復，或等它上線後透過 provider route 測試它。Fable 的理由不是「跟 Opus Fast 同價」。Fable 的理由是「在 Opus 仍難以完成的工作上，少幾輪 steering」。如果你的任務已經能被 Opus 4.8 解掉，Fast Mode 買到的是更好的使用者體驗。如果你的任務失敗是因為模型撐不住整個計畫，Fable 才是值得付錢的那個。

我的預設 routing 規則很簡單：

即時 coding loops 用 Opus 4.8 Fast Mode 出貨。
成本受控的背景工作保留 Opus 4.8 standard。
只有最困難的 async tasks，在 Fable 5 可用時 route 過去。
衡量 task cost，不要只看 token price。

如果你想用低摩擦方式測這套路由，從 Claude Fable 5 on OneHop 開始，然後領取 $10 free。重點不是崇拜 frontier model。重點是停止把 model choices 寫死在你的 agent 裡，並把取捨攤開來。