← Все статьи
Compare

Claude Fable 5 против Opus 4.8 Fast Mode: та же цена за токены, другой компромисс

A split comparison dashboard on cream paper: left column “Fable 5” with long-horizon agent loops and safeguard gates, ri

Anthropic случайно сформулировала самый чистый вопрос выбора модели в июне 2026 года: если Claude Fable 5 стоит $10 за миллион входных токенов и $50 за миллион выходных, а Opus 4.8 Fast Mode тоже стоит $10/$50, что разработчику реально запускать?

Это не абстрактное упражнение для таблицы. По состоянию на 19 июня собственная страница Fable у Anthropic говорит: “Claude Fable 5 is currently unavailable” — и указывает цену $10/M за вход и $50/M за выход (Anthropic). Страница цен Claude указывает для Opus 4.8 $5/M за вход и $25/M за выход, а затем говорит, что Fast Mode дает “up to 2.5x faster speeds” за 2x стандартной цены (Claude pricing). Считаем: Opus 4.8 Fast Mode выходит на тот же тариф за токены, что и Fable 5.

От этого выбор становится острее. Fable — более амбициозная модель. Opus 4.8 Fast Mode — модель, вокруг которой можно проектировать продукт, когда важна задержка, а доступ не должен быть «может быть».

Горизонтальный график цены и производительности, сравнивающий Fable 5, Opus 4.8 standard и Opus 4.8 Fast Mode; ось x — указанный выход

Таблица цен, которая меняет выбор

Вот таблица, с которой разработчикам стоит начинать:

ModelAvailability on June 19, 2026InputOutputContext / outputSpeed noteBest fit
Claude Fable 5Сейчас недоступна$10/MTok$50/MTok1M контекста, до 128k выходаСоздана для долгой агентной работыСложные, неоднозначные, многоэтапные проекты
Claude Opus 4.8Доступна$5/MTok$25/MTok1M контекста по стандартной ценеСтандартная скоростьСложный кодинг, корпоративные агенты
Claude Opus 4.8 Fast ModeResearch preview / дополнительное использование Claude Code$10/MTok$50/MTokТе же правила контекста по тарифу Opus 4.8До 2.5x быстрее выходАгентные циклы, чувствительные к задержке

Спецификации Fable взяты из API-документации Anthropic: у Fable 5 по умолчанию окно контекста 1M токенов, поддержка до 128k выходных токенов на запрос и цена $10/$50 (Claude API docs). В той же документации сказано, что adaptive thinking всегда включен для Fable и Mythos, а thinking: {"type": "disabled"} не поддерживается.

Вот эта последняя деталь важна. Fable — это не просто «Opus, но умнее». У нее другой рабочий профиль: больше автономности, больше самопроверок, часто более длинные прогоны. Anthropic описывает ее как модель для “ambitious, long-running, asynchronous work” и говорит, что в агентных обвязках она может работать днями (Anthropic Fable page). Это ровно противоположно тому, что нужно, если ваш продукт держится на коротких интерактивных итерациях.

Opus 4.8 Fast Mode — более чистая замена, когда узкое место — реальное время ожидания. Страница Anthropic про Fast Mode говорит, что Opus 4.8 Fast Mode — это высокоскоростная конфигурация с 2.5x более быстрым выводом токенов и “the same Opus-level model intelligence” (Claude Fast Mode). Документация по ценам API указывает для Fast Mode Opus 4.8 $10/M за вход и $50/M за выход (Claude API pricing).

Та же цена за токены. Совсем другая ставка.

О чем на самом деле спорит сообщество

Тред на Hacker News вокруг запуска Fable был не столько про «умная ли она?», сколько про то, сколько инициативы разработчики хотят от модели, которая умеет действовать сама. Обсуждение запуска стоит прочитать, потому что оно хорошо формулирует главный конфликт: проактивность кажется магией, когда модель чинит то, о чем вы забыли; и кажется дорогой или опасной, когда она решает расширить scope без разрешения (Hacker News).

Reddit был практичнее. В одном benchmark-посте на r/ClaudeAI автор прогнал 200 headless-сессий claude -p и сообщил, что Fable 5 в сыром использовании выглядела в 2–3 раза дороже Opus 4.8, хотя прайс-лист ровно в 2 раза выше. Там же был неожиданный результат по управляемости: Opus 4.6 набрала 88/90 по их метрике следования инструкциям, Fable 5 — 83/90, а Opus 4.8 — 80/90 (Reddit). Относитесь к этому как к обвязке одного пользователя, а не универсальному benchmark, но паттерн совпадает с тем, что видят многие строители агентов: стоимость — это не только карточка тарифов. Это еще длина ответа, повторы, вызовы инструментов и склонность модели перепланировать.

Другое сравнение на Reddit по 917 сценариям кодинг-агентов показало Fable 5 с общим результатом 92.9 и примерно $1.25 за задачу, против Opus 4.8 с 92.0 и примерно $0.74 за задачу. То есть плюс 0.9 пункта примерно за 73% премии к стоимости задачи в этом benchmark (Reddit). Полезна здесь не точная оценка. Полезна форма компромисса: Fable может выигрывать на сложных задачах, но премия окупается только если эти задачи реально проваливаются на Opus или требуют слишком много итераций.

Есть и настоящая операционная боль. Fable запустили 9 июня, а 12 июня Anthropic сообщила, что приостанавливает доступ к Fable 5 и Mythos 5 после директивы правительства США по экспортному контролю (Anthropic statement). Поэтому «просто подождем Fable» — не план, если вы выпускаете кодинг-агента на этой неделе.

Схема семейства моделей: Sonnet и Haiku в основании, Opus 4.8 над ними, Opus 4.8 Fast Mode как оптимизированный по скорости вариант

Используйте Opus 4.8 Fast Mode, когда задержка — это продукт

Если вы строите IDE-агента, CI-бота для починки, инструмент браузерной автоматизации или live-помощника для code review, задержка — не vanity metric. Она меняет поведение пользователей.

Медленный агент заставляет разработчиков пакетировать запросы, уходить в другую вкладку или переставать доверять циклу. Более быстрый агент может попросить подтверждение, запустить тест, пропатчить файл и стримить прогресс так, чтобы сессия не казалась мертвой. Для таких workflow Opus 4.8 Fast Mode — лучший дефолт при цене за токены на уровне Fable.

Используйте Opus 4.8 Fast Mode, когда:

  1. Задача интерактивная. Примеры: «почини падающий тест», «объясни этот stack trace», «отредактируй этот компонент», «сгенерируй миграцию и запусти ее».
  2. У вас уже есть хорошая обвязка. Если у агента есть поиск по repo, запуск тестов, review патчей и rollback, вам могут быть нужнее быстрые итерации, чем более автономная базовая модель.
  3. Вам нужен предсказуемый routing. Safety classifiers у Fable могут отклонять некоторые запросы, а Anthropic говорит, что помеченные запросы про cybersecurity, biology, chemistry или distillation могут уходить с Fable на Opus 4.8 (Anthropic launch post). Это разумный safety design, но это еще одна развилка в production-пути.
  4. У вашего агента есть user-facing дедлайны прогресса. Явное обещание Fast Mode — скорость. Обещание Fable — амбиция.

Убийственный сценарий для Opus 4.8 Fast Mode — внутренний цикл агента:

claude -p "Run the failing test, patch the smallest fix, rerun only that test, and summarize the diff."

Этой задаче не нужны дни автономии. Ей нужны быстрые чтение, правка, тест, отчет. Платить цену Fable за Opus с более быстрым выводом здесь рационально.

Используйте Fable 5, когда сложная часть — управление, а не скорость

Fable все еще та модель, которую я бы хотел для грязных проектов, которые не помещаются в 90-секундный coding turn. Anthropic говорит, что преимущество Fable растет на более длинных и сложных задачах, и описывает сильные стороны в software engineering, knowledge work, vision, memory и scientific research (Anthropic launch post). В документации также сказано, что она создана для demanding reasoning и long-horizon agentic work (Claude API docs).

Используйте Fable 5, когда:

  1. Вы можете запускать асинхронно. Поставьте задачу в очередь, стримьте статус, дайте ей работать.
  2. У задачи неясная декомпозиция. Примеры: большая миграция, multi-repo refactor, путь от дизайна к реализации, расследование benchmark, синтез research.
  3. Вы хотите, чтобы модель сама проверяла свою работу. Позиционирование Fable — скорее «senior agent», чем «быстрый ассистент».
  4. Меньше итераций ценнее, чем более быстрые итерации. Если Fable экономит три раунда человеческого steering, тот же тариф $10/$50 за токены, что у Opus Fast, может оказаться дешевым.

Загвоздка — доступ. Текущие публичные страницы Anthropic говорят, что Fable недоступна. Чистая fallback-архитектура — сделать Fable опциональным top-tier маршрутом, а не единственным маршрутом:

interactive task -> Opus 4.8 Fast Mode
routine batch task -> Opus 4.8 standard or Sonnet
hard async task -> Fable 5 when available
flagged / refused Fable request -> Opus 4.8 fallback

Именно здесь естественно вписывается OneHop. Если ваш блокер — попробовать Fable без перестройки provider layer, OneHop указывает anthropic/claude-fable-5 как model endpoint, помечает его временно недоступным и показывает $10 бесплатного кредита для новых аккаунтов без карты (OneHop). Страница, которую я проверял, указывает поддержку Anthropic Messages на https://api.onehop.ai/anthropic и показывает скидочную цену относительно официального списка $10/$50.

from anthropic import Anthropic

client = Anthropic(
    base_url="https://api.onehop.ai/anthropic",
    api_key="<ONEHOP_KEY>",
)

message = client.messages.create(
    model="anthropic/claude-fable-5",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Plan a safe, staged migration from Jest to Vitest."}],
)

print(message.content[0].text)

Если ваша интеграция OpenAI-compatible и ваш аккаунт OneHop настроен на /v1 gateway, паттерн миграции тот же: поменяйте base URL на https://api.onehop.ai/v1, держите model routing вне business logic и меняйте model IDs через конфиг. Конкретно для Fable проверьте поддерживаемый protocol на живой странице модели OneHop перед деплоем.

Архитектурный набросок роутера coding-agent: запрос пользователя попадает в classifier, затем ветвится на Opus 4.8 Fast Mode

Рекомендация

Не заменяйте Opus 4.8 на Fable 5 глобально. Это дорогая и хрупкая версия миграции.

Для чувствительных к задержке кодинг-агентов используйте Opus 4.8 Fast Mode как замену по цене Fable. Цена за токены та же, обещание скорости явное, и вы не зависите от модели, которая сейчас недоступна. Добавьте Fable 5 как асинхронный escalation path, когда доступ вернется.

Для долгой автономной работы ждите доступ к Fable или тестируйте ее через provider route, когда она снова станет live. Аргумент в пользу Fable — не «та же цена, что у Opus Fast». Аргумент — «меньше steering turns на работе, которую Opus все еще плохо доводит до конца». Если ваши задачи уже решаются Opus 4.8, Fast Mode покупает лучший user experience. Если задачи проваливаются, потому что модель не удерживает весь план, Fable — та, за которую стоит платить.

Мое дефолтное правило routing простое:

  • Запускайтесь с Opus 4.8 Fast Mode для live coding loops.
  • Оставьте Opus 4.8 standard для фоновых задач с контролем стоимости.
  • Отправляйте в Fable 5 только самые сложные async-задачи, когда она доступна.
  • Измеряйте стоимость задачи, а не цену токена.

Если хотите протестировать такой routing с минимальным трением, начните с Claude Fable 5 on OneHop, а затем start with $10 free. Смысл не в том, чтобы поклоняться frontier model. Смысл в том, чтобы перестать hardcode-ить выбор моделей в агенте и сделать компромисс явным.