Claude Fable 5は分類器を使い、一部のサイバー・バイオ・蒸留リクエストをOpus 4.8へルーティングする

Claude Fable 5は2026年6月9日時点で一般提供されています。ただし、送ったリクエストすべてにFable 5自身が答えるわけではありません。Anthropicによると、サイバーセキュリティ、生物学と化学、または蒸留に関する新しい安全対策でフラグされた一部のリクエストは、代わりにClaude Opus 4.8が自動的に処理します。初期データでは、Fableのセッションの95%以上でフォールバックはまったく発生していません（Anthropic）。

この実装上の細部は、ローンチの見出しより重要です。エージェントをデバッグしているとき、評価を回しているとき、モデル品質を比較しているとき、「Fable 5を呼んだ」は、もはや常に「Fable 5が答えた」と同じではありません。場合によっては、プロダクト画面、または設定した場合はAPI統合が、そのリクエストをOpus 4.8へルーティングします。

Fable 5とMythos 5が同じ基盤モデルブロックを共有し、Fable pを示すカバー風のモデルファミリー図

Anthropicが実際に出荷したもの

Anthropicは6月9日に、関連する2つのモデル、Claude Fable 5とClaude Mythos 5をローンチしました。Fable 5は一般提供版です。Mythos 5は制限付きで、当初はProject Glasswingのパートナー向け、その後は選ばれた信頼アクセスプログラム向けに提供されます（Anthropic）。

同社はFable 5を、一般利用向けに安全化された「Mythosクラス」のモデルだと説明しています。プロダクトページでは、長時間走るコーディング、エージェント的な作業、エンタープライズワークフロー、画像を多用するドキュメントタスク向けとして位置づけています（Anthropic）。APIドキュメントでは、claude-fable-5はAnthropicが広くリリースしている中で最も高性能なモデルとされ、1Mトークンのコンテキストウィンドウ、128kの最大出力、常時オンの適応的思考、入力100万トークンあたり10ドル・出力100万トークンあたり50ドルの料金が示されています（Claude API docs）。

開発者が押さえるべきモデル像は、短くまとめるとこうです。

Model	API ID	Availability	Context	Max output	Price per 1M tokens
Claude Fable 5	`claude-fable-5`	一般提供	1M	128k	入力 $10 / 出力 $50
Claude Mythos 5	`claude-mythos-5`	制限付き、Project Glasswingおよび信頼アクセス	1M	128k	入力 $10 / 出力 $50
Claude Opus 4.8	`claude-opus-4-8`	一般提供	Claude API、Bedrock、Vertex AIで1M	128k	入力 $5 / 出力 $25

重要な違いは性能だけではありません。ポリシー面です。Anthropicのローンチ投稿によれば、Fable 5は追加の安全対策を備えた公開モデルです。Mythos 5は、承認済みユーザー向けに一部の安全対策が外された、同じ基盤モデルです（Anthropic）。

フォールバック経路

Anthropicによると、Fable 5は新しい分類器のセットを使っています。これは潜在的な悪用や脱獄の試みを検出する、別個のAIシステムです。これらの分類器がサイバーセキュリティ、生物学と化学、または蒸留に関するリクエストを検出すると、その応答は代わりにClaude Opus 4.8によって自動的に処理されます（Anthropic）。

Help Centerでは、同じ挙動をもう少しプロダクト寄りに説明しています。Fable 5はすべてのリクエストに対して自動安全チェックを実行します。これらのチェックは、攻撃的なサイバーセキュリティ技術、生物学や生命科学のクエリ、要約された思考の抽出、分散学習インフラや一部のアクセラレータ／カーネル作業など、フロンティアLLM開発タスクの狭い範囲を含む領域をブロックすることを意図しています（Claude Help Center）。

そのページでは、チェック対象は最新メッセージだけではないとも述べています。メモリ、コネクタの内容、Web結果、ファイルのいずれもブロックの引き金になりえます。これはデバッグ上の罠です。ユーザーが無害なフォローアップを尋ねただけでも、会話内に以前貼り付けられたエクスプロイトの解説、ラボ手順、モデル学習メモが分類器を作動させることがあります。

Claudeのコンシューマー向けおよびワークスペース向け画面では、Fable 5が選択されていると自動切り替えがデフォルトで有効です。あるターンが切り替えられると、ユーザーには通知が表示され、回答には応答したモデル名がラベル表示されます。切り替え後、その会話の残りでは、ユーザーが戻さない限り、モデルピッカーはOpus 4.8のままになります（Claude Help Center）。

ユーザープロンプトとファイルがFable 5の分類器チェックに入り、安全なリクエストはFable rへ進む、左から右へのリクエストフロー図

開発者が気づく理由

フォールバックは、「モデルの挙動」に関する新しい種類のバグを生みます。

第一に、評価が混合モデル評価になりえます。テストセットに脆弱性分析、セキュリティ強化、合成生物学、化学、医学研究、モデル蒸留のプロンプトが含まれている場合、一部の行はOpus 4.8によって回答されるかもしれません。ハーネスが記録しているのがリクエストしたモデルだけなら、その結果を誤って帰属することになります。

第二に、エージェントのトレースが一貫しないように見えることがあります。Fable 5が計画、コード編集、リファクタリングを処理し、その後フラグされたセキュリティレビューのターンをOpus 4.8が答える、ということが起きます。エージェントがサブエージェントを使う場合、すべてのサブエージェント呼び出しにAPI上の独自のフォールバック設定が必要です。Anthropicのcookbookは、APIフォールバックにはアカウントレベルやセッションレベルのスイッチはないと警告しています。各リクエストにフォールバック設定を含める必要があります（Claude Cookbook）。

第三に、課金にはより細かい計測が必要です。AnthropicのHelp Centerによると、Fableが出力を生成する前にブロックされたリクエストは、Opusの料金だけが請求されます。リクエストがストリーム途中でブロックされた場合、入力とすでにストリーミングされたトークンはFable料金で請求され、残りはOpus料金で請求されます（Claude Help Center）。

APIユーザーにとって、サーバーサイドのフォールバック経路はこう見えます。

curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: server-side-fallback-2026-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-fable-5",
    "max_tokens": 1024,
    "fallbacks": [{ "model": "claude-opus-4-8" }],
    "messages": [{ "role": "user", "content": "Hello, world" }]
  }'

本番での本当の助言はこうです。requested_modelとresponse_modelの両方をログに残すこと。さらに、停止理由、公開される場合はフォールバックカテゴリ、応答がストリーミングされたかどうか、サブエージェントやリトライ経路がそのリクエストを組み立てたかどうかも記録してください。

安全性に敏感なワークフローには別評価が必要

Fable 5は、長期的なコーディングや知識作業のデフォルトとしては適切かもしれません。しかし、セキュリティ、生物学、化学、ヘルスケア、モデル学習に触れるすべてのワークフローに対して、自動的に正しいデフォルトになるわけではありません。

Anthropicは、安全対策が保守的であり、無害なリクエストを捕まえる可能性があると明言しています。ローンチ投稿では、同社がモデルを「安全かつ迅速に」リリースするためにこのように調整したと述べており、Anthropicが範囲を狭める作業を進める間、誤検知は想定されるとしています（Anthropic）。Help Centerでは、ブロックされる可能性のある正当な作業の例として、許可されたセキュリティテスト、良性の生物学研究、バイオテック企業の文書作成、医用画像と診断、臨床上の質問、基礎的な生物教育を挙げています（Claude Help Center）。

つまり、評価スイートは少なくとも3つのバケットに分けるべきです。

Fableが直接答えるべき通常のプロダクトトラフィック。
フォールバックが想定され、許容されるデュアルユースまたはセンシティブなトラフィック。
リクエスト自体は無害だが、分類器の境界に触れやすい誤検知プローブ。

これらを平均して「Fable 5の品質」と呼んではいけません。各バケットについて、回答品質、フォールバック率、レイテンシ、拒否率、コスト、ユーザーに見えるメッセージを追跡してください。バイオテック顧客向けのサポートボットを運用しているなら、3%のフォールバック率は普通かもしれません。フロントエンド移行向けのコーディングアシスタントを運用していて3%なら、プロンプトテンプレートが誤ってセキュリティやモデル抽出の言葉をコンテキストに引き込んでいる可能性があります。

通常トラフィック、センシティブトラフィック、誤検知pとラベル付けされた3列のコンパクトな評価ダッシュボードのモックアップ

保持期間の変更も話の一部

Fable 5には、一部のビジネス顧客向けのデータ保持変更も含まれています。Anthropicによると、Mythosクラスモデルのプロンプトと出力は、2026年6月9日以降、それらのモデルが提供されるすべてのプラットフォームで、信頼と安全の目的のために30日間保持されます（Claude Help Center）。

これは、以前ゼロデータ保持を使っていた組織にとって最も重要です。Anthropicによると、この変更はClaude ConsoleのZDRワークスペース、Claude Enterprise内のZDR付きClaude Code、そしてZDR付きのAWS Bedrock、Google Cloud Agent Platform、Microsoft Foundry経由のアクセスに適用されます。他のモデルは、この特定のポリシーの影響を受けません（Claude Help Center）。

開発者にとって、これは法務上の脚注ではなく、アーキテクチャ上の問題になります。Fable 5を本番経路に入れる前に、別ワークスペース、サンドボックス組織、またはプロバイダー固有の保持設定が必要になるかもしれません。データ分類ルールが30日保持を禁じているなら、セキュリティチームと法務チームが構成を承認するまで、別のモデルを使ってください。

Fable 5が適したモデルになるとき

Fable 5は、粘り強さ、長いコンテキスト、高い自律性が効くタスクで使うのがよいです。大規模移行、複数ステップのリファクタリング、複雑なドキュメント推論、画像中心の分析、自分の作業を計画してテストする必要があるエージェントなどです。Anthropic自身の位置づけも、安価な大量補完ではなく、「数日がかり」の非同期タスクを指しています（Anthropic）。

タスクが分類器の境界近くにある場合は、もっと慎重になるべきです。セキュリティコパイロット、生物学研究アシスタント、化学検索ツール、モデル学習プラットフォーム、評価ハーネスは、フォールバックを想定状態として扱う必要があります。どのモデルが答えたかをユーザーが見られるようにUIとログを作ってください。回帰が謎の品質低下ではなく、「フォールバック率が変わった」として見えるようにテストを組んでください。

それでも、このローンチは大きな出来事です。Anthropicは、Mythosクラスのモデルを一般提供し、公開価格、APIアクセス、文書化されたフォールバック経路を用意しました。ただし開発者にとっての運用上の結論は単純です。Fable 5はルーティングされるシステムです。単一の静的モデルのように出荷すると、トレース、評価、請求はやがて現実と食い違います。

Claude Fable 5を自分で試したいなら、差し替え可能なエンドポイントとしてClaude Fable 5 on OneHopを使えます。定価より約30%安く利用できます。新規アカウントはカード不要で、$10無料から始められます。

さらに読む: Claude Fable 5入門.