Claude Fable 5 vs Opus 4.8 Fast Mode：同じトークン価格、違うトレードオフ

Anthropicは、2026年6月時点でいちばんすっきりしたモデル選びの問いを、うっかり作ってしまった。Claude Fable 5が入力100万トークンあたり10ドル、出力100万トークンあたり50ドルで、Opus 4.8 Fast Modeも10ドル/50ドルなら、開発者は実際どちらを使うべきなのか？

これは机上のスプレッドシート遊びではない。6月19日時点で、Anthropic自身のFableページには「Claude Fable 5 is currently unavailable」とあり、価格は入力10ドル/M、出力50ドル/Mと記載されている（Anthropic）。Claudeの価格ページではOpus 4.8が入力5ドル/M、出力25ドル/Mとされ、そのうえでFast Modeは標準価格の2倍で「最大2.5倍高速」と説明されている（Claude pricing）。計算してみればいい。Opus 4.8 Fast Modeは、Fable 5と同じトークン単価に着地する。

だからこそ判断は鋭くなる。Fableはより野心的なモデルだ。Opus 4.8 Fast Modeは、レイテンシが重要で、アクセスできるかどうかが「運次第」では困るときに設計の土台にできるモデルだ。

Fable 5、Opus 4.8 standard、Opus 4.8 Fast Modeを比較する横向きの価格/性能チャート。x軸は出力価格を示している

選択を変える価格表

開発者がまず見るべき、地に足のついた表はこれだ。

Model	2026年6月19日時点の利用可否	Input	Output	Context / output	速度メモ	最適な用途
Claude Fable 5	現在利用不可	$10/MTok	$50/MTok	1M context, up to 128k output	長時間のエージェント的作業向け	難しく、曖昧で、多段階のプロジェクト
Claude Opus 4.8	利用可能	$5/MTok	$25/MTok	標準価格で1M context	標準速度	複雑なコーディング、エンタープライズ向けエージェント
Claude Opus 4.8 Fast Mode	リサーチプレビュー / Claude Code追加使用量	$10/MTok	$50/MTok	Opus 4.8と同じcontextルール	出力が最大2.5倍高速	レイテンシ重視のエージェントループ

Fableの仕様はAnthropicのAPI docsにある。Fable 5はデフォルトで100万トークンのcontext windowを持ち、1リクエストあたり最大128kの出力トークンをサポートし、価格は10ドル/50ドルだ（Claude API docs）。同じドキュメントには、FableとMythosではadaptive thinkingが常にオンで、thinking: {"type": "disabled"}はサポートされないとも書かれている。

この最後の点は重要だ。Fableは単なる「Opusの賢い版」ではない。動き方そのものが違う。より自律的で、より自己検証的で、しばしばより長く動き続ける。Anthropicはこれを「野心的で、長時間実行される、非同期の作業」向けだと説明し、エージェントハーネス内で何日も作業できるとしている（Anthropic Fable page）。これは、プロダクトがきびきびした対話ターンに依存している場合に欲しいものとは、まさに正反対だ。

ボトルネックが実時間なら、Opus 4.8 Fast Modeのほうがきれいな代替になる。AnthropicのFast Modeページでは、Opus 4.8 Fast Modeは出力トークン速度が2.5倍速い高速設定で、「同じOpusレベルのモデル知能」を備えると説明されている（Claude Fast Mode）。API pricing docsでは、Fast Mode Opus 4.8が入力10ドル/M、出力50ドル/Mと記載されている（Claude API pricing）。

同じトークン価格。だが賭けているものは違う。

コミュニティが実際に揉めていること

FableローンチをめぐるHacker Newsのスレッドは、「賢いのか？」という話よりも、主導権を持って動けるモデルに対して、開発者がどこまでのエージェンシーを望むのかという話だった。このローンチ議論は読む価値がある。中核の緊張関係をうまく示しているからだ。モデルがあなたの見落とした問題を直してくれるとき、プロアクティブさは魔法のように見える。だが、許可なくスコープを広げると、それは高くつくし、危険にも見える（Hacker News）。

Redditのほうはもっと実務寄りだ。あるr/ClaudeAIのベンチマーク投稿では、200回のヘッドレスclaude -pセッションを走らせ、Fable 5は実使用ではOpus 4.8より2〜3倍高く見えたと報告している。定価ではちょうど2倍なのに、だ。同じ投稿では、意外な制御性の結果も出ている。命令追従の測定で、Opus 4.6は88/90、Fable 5は83/90、Opus 4.8は80/90だった（Reddit）。これはあくまで一人のユーザーのハーネスであり、普遍的なベンチマークではない。ただ、その傾向は多くのエージェント開発者が見ているものと合っている。コストとはレートカードだけではない。出力の長さ、リトライ、ツール呼び出し、そしてモデルが過剰に計画するかどうかもコストだ。

917件のコーディングエージェントシナリオにわたる別のReddit比較では、Fable 5は総合92.9、タスクあたり約1.25ドル、Opus 4.8は92.0、タスクあたり約0.74ドルと報告されている。そのベンチマークでは、0.9ポイントの上昇に対して、タスクコストはおよそ73%増しだ（Reddit）。有用なのは正確なスコアではない。トレードの形だ。Fableは難しいタスクでは勝つかもしれない。だが、そのプレミアムが回収できるのは、そのタスクが本当にOpusで失敗している、あるいはターン数がかかりすぎている場合だけだ。

運用上の不満も現実にある。Fableは6月9日にローンチされたが、Anthropicは6月12日、米国政府の輸出規制指令を受けてFable 5とMythos 5へのアクセスを一時停止すると発表した（Anthropic statement）。だから、今週コーディングエージェントを出荷するなら、「Fableを待てばいい」は計画ではない。

SonnetとHaikuを土台に、その上にOpus 4.8、さらに速度最適化版としてOpus 4.8 Fast Modeを示すモデルファミリー図

レイテンシがプロダクトならOpus 4.8 Fast Modeを使う

IDEエージェント、CI修復ボット、ブラウザ自動化ツール、ライブコードレビューアシスタントを作っているなら、レイテンシは見栄えのための指標ではない。ユーザーの行動を変えるものだ。

遅いエージェントは、開発者にリクエストをまとめさせ、別タブへ逃がし、ループを信用しなくさせる。速いエージェントなら、確認を求め、テストを走らせ、ファイルをパッチし、進捗をストリーミングしても、セッションが死んだようには感じさせない。こうしたワークフローでは、Fable相当のトークン価格で使えるOpus 4.8 Fast Modeのほうがデフォルトとして優れている。

Opus 4.8 Fast Modeを使うべき場面はこうだ。

タスクが対話的である。例：「この落ちているテストを直して」「このスタックトレースを説明して」「このコンポーネントを編集して」「マイグレーションを生成して実行して」。
すでに良いハーネスがある。エージェントにリポジトリ検索、テスト実行、パッチレビュー、ロールバックがあるなら、より自律的な基盤モデルより、速いターンのほうが必要かもしれない。
予測可能なルーティングが必要である。Fableの安全分類器は特定のリクエストを拒否することがあり、Anthropicは、フラグが立ったサイバーセキュリティ、生物学、化学、蒸留のリクエストはFableからOpus 4.8へルーティングされる場合があるとしている（Anthropic launch post）。これは健全な安全設計だが、本番経路にもう一つ分岐が増えるということでもある。
エージェントにユーザー向けの進捗締切がある。Fast Modeの明確な約束は速度だ。Fableの約束は野心だ。

Opus 4.8 Fast Modeの決定的なユースケースは、エージェントの内側のループだ。

claude -p "Run the failing test, patch the smallest fix, rerun only that test, and summarize the diff."

この仕事に何日もの自律性はいらない。必要なのは、速く読み、編集し、テストし、報告することだ。そこでFableの価格を払い、より高速出力のOpusを使うのは合理的だ。

難しいのが速度ではなく制御ならFable 5を使う

Fableは、それでも90秒のコーディングターンに収まらない厄介なプロジェクトで使いたいモデルだ。Anthropicは、タスクが長く複雑になるほどFableの優位性が広がるとし、ソフトウェアエンジニアリング、知識労働、ビジョン、メモリ、科学研究で強みがあると説明している（Anthropic launch post）。ドキュメントにも、要求の厳しい推論と長期視点のエージェント的作業向けに作られているとある（Claude API docs）。

Fable 5を使うべき場面はこうだ。

非同期で実行できる。ジョブをキューに入れ、ステータスをストリーミングし、作業させる。
タスクの分解がはっきりしない。例：大規模マイグレーション、複数リポジトリのリファクタ、設計から実装まで、ベンチマーク調査、研究の統合。
モデルに自分の作業を検証してほしい。Fableの位置づけは「高速アシスタント」よりも「シニアエージェント」に近い。
速いターンより、少ないターンの価値が高い。Fableが人間による3回の軌道修正を節約するなら、Opus Fastと同じ10ドル/50ドルのトークン単価は安くなりうる。

問題はアクセスだ。Anthropicの現在の公開ページでは、Fableは利用不可とされている。きれいなフォールバック設計は、Fableを唯一のルートではなく、任意の最上位ルートにすることだ。

interactive task -> Opus 4.8 Fast Mode
routine batch task -> Opus 4.8 standard or Sonnet
hard async task -> Fable 5 when available
flagged / refused Fable request -> Opus 4.8 fallback

ここでOneHopも自然に入ってくる。Fableを試したいがプロバイダーレイヤーを作り直したくない、というのが詰まりどころなら、OneHopはanthropic/claude-fable-5をモデルエンドポイントとして掲載し、一時的に利用不可と示しつつ、新規アカウントにはカード不要で10ドルの無料クレジットを表示している（OneHop）。私が確認したページでは、https://api.onehop.ai/anthropicでAnthropic Messagesをサポートしているとあり、公式の10ドル/50ドルの定価に対する割引価格も表示されていた。

from anthropic import Anthropic

client = Anthropic(
    base_url="https://api.onehop.ai/anthropic",
    api_key="<ONEHOP_KEY>",
)

message = client.messages.create(
    model="anthropic/claude-fable-5",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Plan a safe, staged migration from Jest to Vitest."}],
)

print(message.content[0].text)

あなたの統合がOpenAI互換で、OneHopアカウントが/v1ゲートウェイ向けに設定されているなら、移行パターンの考え方は同じだ。base URLをhttps://api.onehop.ai/v1に変え、モデルルーティングをビジネスロジックの外に置き、モデルIDを設定で差し替える。Fableについては特に、本番投入前にライブのOneHopモデルページで対応プロトコルを確認してほしい。

コーディングエージェントルーターのアーキテクチャフロー図。ユーザーリクエストが分類器に入り、Opus 4.8 Fast Modeなどへ分岐する

推奨

Opus 4.8をFable 5で一括置き換えしてはいけない。それは高くつき、壊れやすい移行だ。

レイテンシ重視のコーディングエージェントでは、Fable価格の代替としてOpus 4.8 Fast Modeを使うべきだ。トークン価格は同じで、速度の約束は明確で、現在利用不可のモデルに依存せずに済む。Fable 5は、アクセスが戻ったときの非同期エスカレーション経路として追加すればいい。

長時間の自律作業では、Fableへのアクセスを待つか、利用可能になったらプロバイダールート経由でテストする。Fableの根拠は「Opus Fastと同じ価格」ではない。「Opusがまだ完了に苦労する作業で、軌道修正ターンを減らせる」ことだ。あなたのタスクがすでにOpus 4.8で解けているなら、Fast Modeはより良いユーザー体験を買うものだ。モデルが全体計画を保持できずタスクが失敗しているなら、Fableこそ払う価値がある。

私のデフォルトのルーティングルールは単純だ。

ライブのコーディングループはOpus 4.8 Fast Modeで出荷する。
コスト管理されたバックグラウンドジョブにはOpus 4.8 standardを残す。
Fable 5が利用可能なときだけ、最難関の非同期タスクをルーティングする。
トークン価格ではなく、タスクコストを測る。

このルーティングを低摩擦で試したいなら、Claude Fable 5 on OneHopから始めて、その後10ドル無料で開始すればいい。重要なのは、フロンティアモデルを崇拝することではない。モデル選択をエージェントにハードコードするのをやめ、トレードオフを明示することだ。