Claude Fable 5 использует классификаторы, которые перенаправляют часть запросов по кибербезопасности, биологии и дистилляции в Opus 4.8

Claude Fable 5 стал общедоступен 9 июня 2026 года, но он отвечает не на каждый запрос, который вы ему отправляете. Anthropic говорит, что часть запросов, отмеченных новыми защитными механизмами в области кибербезопасности, биологии и химии или дистилляции, автоматически обрабатывается Claude Opus 4.8, а ранние данные показывают, что более 95% сессий Fable вообще обходятся без fallback (Anthropic).

Эта одна деталь реализации важнее громкого заголовка о запуске. Если вы отлаживаете агента, гоняете evals или сравниваете качество моделей, “я вызвал Fable 5” больше не всегда означает “ответил Fable 5”. Иногда продуктовый интерфейс — или ваша API-интеграция, если вы ее так настроите, — перенаправит запрос в Opus 4.8.

Диаграмма семейства моделей в стиле обложки: Fable 5 и Mythos 5 используют один и тот же базовый модельный блок, с Fable p

Что Anthropic на самом деле выпустила

9 июня Anthropic запустила две связанные модели: Claude Fable 5 и Claude Mythos 5. Fable 5 — общедоступная версия. Mythos 5 ограничена: сначала для партнеров Project Glasswing, позже — для отдельных программ доверенного доступа (Anthropic).

Компания описывает Fable 5 как модель “класса Mythos”, сделанную безопасной для общего использования. На продуктовой странице ее позиционируют для долгих задач по программированию, агентной работы, корпоративных workflows и задач с документами, где много визуального контента (Anthropic). В документации API claude-fable-5 указана как самая мощная широко выпущенная модель Anthropic: контекстное окно 1M токенов, максимальный вывод 128k, адаптивное мышление всегда включено, цена $10 за миллион входных токенов и $50 за миллион выходных токенов (Claude API docs).

Вот компактная картина моделей, которая нужна разработчикам:

Модель	API ID	Доступность	Контекст	Макс. вывод	Цена за 1M токенов
Claude Fable 5	`claude-fable-5`	Общедоступна	1M	128k	$10 input / $50 output
Claude Mythos 5	`claude-mythos-5`	Ограниченно, Project Glasswing и доверенный доступ	1M	128k	$10 input / $50 output
Claude Opus 4.8	`claude-opus-4-8`	Общедоступна	1M на Claude API, Bedrock, Vertex AI	128k	$5 input / $25 output

Важное разделение — не только в возможностях. Оно в политической поверхности. Fable 5 — публичная модель с дополнительными защитными механизмами. Mythos 5 — та же базовая модель, но с частью снятых ограничений для одобренных пользователей, согласно посту Anthropic о запуске (Anthropic).

Маршрут fallback

Anthropic говорит, что Fable 5 использует новый набор классификаторов — отдельные AI-системы, которые выявляют потенциальное злоупотребление и попытки jailbreak. Когда эти классификаторы обнаруживают запрос, связанный с кибербезопасностью, биологией и химией или дистилляцией, ответ автоматически обрабатывает Claude Opus 4.8 вместо Fable 5 (Anthropic).

Help Center дает более продуктовую версию того же поведения. Fable 5 запускает автоматические проверки безопасности для каждого запроса. Эти проверки должны блокировать области вроде наступательных техник кибербезопасности, запросов по биологии и наукам о жизни, извлечения краткого пересказа мышления, а также узкого набора задач по разработке frontier LLM — например, инфраструктуры распределенного обучения и некоторых работ с ускорителями или kernel (Claude Help Center).

На той же странице сказано, что проверки смотрят не только на последнее сообщение. Memory, содержимое connectors, веб-результаты и файлы тоже могут сработать как триггер. Это ловушка для отладки. Пользователь может задать безобидный уточняющий вопрос, но прежняя вставленная заметка с exploit, лабораторный протокол или заметка об обучении модели в разговоре могут зацепить классификатор.

В потребительских и рабочих интерфейсах Claude автоматическое переключение включено по умолчанию, когда выбран Fable 5. Если ход переключен, пользователь видит уведомление, а ответ помечается моделью, которая ответила. После переключения селектор модели остается на Opus 4.8 до конца этого разговора, если пользователь сам не переключит его обратно (Claude Help Center).

Схема потока запроса слева направо: пользовательский prompt и файлы попадают в проверки классификаторов Fable 5, безопасные запросы идут в Fable r

Почему разработчики это заметят

Fallback создает новый класс багов “поведения модели”.

Во-первых, evals могут стать evals со смесью моделей. Если ваш тестовый набор включает анализ уязвимостей, усиление безопасности, синтетическую биологию, химию, медицинские исследования или prompts для дистилляции моделей, часть строк может получить ответ от Opus 4.8. Если ваш harness записывает только запрошенную модель, вы неверно припишете результат.

Во-вторых, трассы агентов могут выглядеть непоследовательными. Fable 5 может заниматься планированием, правками кода и рефакторингом, а затем Opus 4.8 ответит на помеченный ход ревью безопасности. Если агент использует subagents, каждому вызову subagent нужна собственная конфигурация fallback в API. Cookbook Anthropic предупреждает: для API fallback нет переключателя на уровне аккаунта или сессии. Каждый запрос должен включать настройку fallback (Claude Cookbook).

В-третьих, биллинг требует более тщательной инструментализации. Help Center Anthropic говорит, что запрос, заблокированный до того, как Fable успел сгенерировать вывод, тарифицируется только по ставкам Opus. Если запрос блокируется посреди стрима, входные и уже переданные токены тарифицируются по ставкам Fable, а остальная часть — по ставкам Opus (Claude Help Center).

Для пользователей API серверный путь fallback выглядит так:

curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: server-side-fallback-2026-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-fable-5",
    "max_tokens": 1024,
    "fallbacks": [{ "model": "claude-opus-4-8" }],
    "messages": [{ "role": "user", "content": "Hello, world" }]
  }'

Настоящий продакшен-совет: логируйте и requested_model, и response_model. Также логируйте stop reasons, категории fallback, если они раскрываются, был ли ответ стриминговым, и собрал ли запрос subagent или путь retry.

Для safety-sensitive workflows нужны отдельные evals

Fable 5 может быть правильным выбором по умолчанию для долгих задач программирования и knowledge work. Но он не автоматически правильный выбор для каждого workflow, где упоминаются безопасность, биология, химия, здравоохранение или обучение моделей.

Anthropic прямо говорит, что защитные механизмы консервативны и могут ловить безвредные запросы. В посте о запуске сказано, что компания настроила их так, чтобы выпустить модель “и безопасно, и быстро”, и что ложные срабатывания ожидаемы, пока Anthropic работает над их сужением (Anthropic). Help Center приводит примеры легитимной работы, которая может быть заблокирована: авторизованное тестирование безопасности, безобидные биологические исследования, бизнес-документация в биотехе, медицинская визуализация и диагностика, клинические вопросы и базовое обучение биологии (Claude Help Center).

Это значит, что ваш набор evals должен делиться минимум на три корзины:

Обычный продуктовый трафик, где Fable должен отвечать напрямую.
Dual-use или чувствительный трафик, где fallback ожидаем и приемлем.
Пробы на ложные срабатывания, где запрос безвреден, но, скорее всего, заденет границы классификатора.

Не усредняйте все это вместе и не называйте “качеством Fable 5”. Для каждой корзины отслеживайте качество ответа, fallback rate, задержку, refusal rate, стоимость и сообщения, видимые пользователю. Если вы запускаете support bot для клиентов из биотеха, fallback rate 3% может быть нормальным. Если вы запускаете ассистента по кодингу для front-end миграций, 3% может означать, что ваши prompt templates случайно тащат в контекст язык про безопасность или извлечение модели.

Компактный макет evaluation dashboard с тремя колонками: normal traffic, sensitive traffic и false-positive p

Изменение retention — тоже часть истории

Fable 5 также выходит с изменением data retention для части бизнес-клиентов. Anthropic говорит, что prompts и outputs для моделей класса Mythos хранятся 30 дней для целей trust and safety на каждой платформе, где эти модели предлагаются, начиная с 9 июня 2026 года (Claude Help Center).

Больше всего это важно для организаций, которые раньше использовали zero data retention. Anthropic говорит, что изменение применяется к ZDR workspaces в Claude Console, Claude Code с ZDR в Claude Enterprise, а также к доступу через AWS Bedrock, Google Cloud Agent Platform или Microsoft Foundry с ZDR. Другие модели этой конкретной политикой не затрагиваются (Claude Help Center).

Для разработчиков это архитектурный вопрос, а не юридическая сноска. Вам может понадобиться отдельный workspace, sandbox org или provider-specific retention configuration, прежде чем Fable 5 можно будет пустить в production path. Если ваши правила классификации данных запрещают 30-дневное хранение, используйте другую модель, пока команды security и legal не одобрят настройку.

Когда Fable 5 — правильная модель

Используйте Fable 5, когда задаче нужны настойчивость, длинный контекст и высокая автономность: крупные миграции, многошаговые рефакторинги, сложное рассуждение по документам, анализ с большим количеством визуальных материалов или агенты, которым нужно планировать и тестировать собственную работу. Собственное позиционирование Anthropic указывает на “многодневные” и асинхронные задачи, а не на дешевые массовые completions (Anthropic).

Будьте осторожнее, когда задача проходит рядом с границей классификатора. Security copilots, ассистенты для биологических исследований, поисковые инструменты по химии, платформы обучения моделей и eval harnesses должны воспринимать fallback как ожидаемое состояние. Стройте UI и логи так, чтобы пользователи видели, какая модель ответила. Стройте тесты так, чтобы регрессии проявлялись как “fallback rate изменился”, а не как загадочный дрейф качества.

Запуск все равно большой. Anthropic сделала модель класса Mythos общедоступной — с публичными ценами, доступом через API и документированным fallback-маршрутом. Но для разработчиков операционный вывод простой: Fable 5 — это routed system. Если вы ship-ите его как одну статичную модель, ваши трассы, evals и счета рано или поздно разойдутся с реальностью.

Если хотите сами попробовать Claude Fable 5, можно использовать Claude Fable 5 on OneHop через drop-in endpoint, примерно на 30% ниже list price. Новые аккаунты могут начать с $10 бесплатно, карта не нужна.

Дополнительно: Getting started with Claude Fable 5.