Claude Fable 5 vs Opus 4.8 Fast Mode: 같은 토큰 가격, 다른 선택지

Anthropic은 2026년 6월, 의도치 않게 가장 깔끔한 모델 선택 질문을 만들어냈다. Claude Fable 5가 입력 토큰 100만 개당 $10, 출력 토큰 100만 개당 $50이고, Opus 4.8 Fast Mode도 $10/$50이라면, 개발자는 실제로 무엇을 돌려야 할까?

이건 이론적인 스프레드시트 놀음이 아니다. 6월 19일 기준, Anthropic의 Fable 페이지는 “Claude Fable 5 is currently unavailable”이라고 말하면서 입력 $10/M, 출력 $50/M 가격을 적고 있다 (Anthropic). Claude 가격 페이지는 Opus 4.8을 입력 $5/M, 출력 $25/M로 표시한 뒤, Fast Mode가 표준 가격의 2배로 “up to 2.5x faster speeds”를 제공한다고 말한다 (Claude pricing). 계산은 간단하다. Opus 4.8 Fast Mode는 Fable 5와 같은 토큰 단가에 도착한다.

그래서 결정은 더 날카로워진다. Fable은 더 야심 찬 모델이다. Opus 4.8 Fast Mode는 지연 시간이 중요하고 접근성이 “될 수도 있고 안 될 수도”이면 안 되는 상황에서 설계의 기준으로 삼을 수 있는 모델이다.

Fable 5, Opus 4.8 표준, Opus 4.8 Fast Mode를 비교한 가로형 가격/성능 차트; x축은 표시된 출력

선택을 바꾸는 가격표

개발자가 먼저 봐야 할 기준표는 이렇다:

모델	2026년 6월 19일 기준 사용 가능 여부	입력	출력	컨텍스트 / 출력	속도 메모	가장 잘 맞는 용도
Claude Fable 5	현재 사용 불가	$10/MTok	$50/MTok	1M 컨텍스트, 최대 128k 출력	장시간 agentic 작업용	어렵고 모호한 다단계 프로젝트
Claude Opus 4.8	사용 가능	$5/MTok	$25/MTok	표준 가격에서 1M 컨텍스트	표준 속도	복잡한 코딩, 엔터프라이즈 에이전트
Claude Opus 4.8 Fast Mode	Research preview / Claude Code 추가 사용량	$10/MTok	$50/MTok	Opus 4.8과 동일한 컨텍스트 규칙	최대 2.5배 빠른 출력	지연 시간에 민감한 에이전트 루프

Fable 사양은 Anthropic의 API 문서에서 나온다. Fable 5는 기본 1M 토큰 컨텍스트 윈도우를 갖고, 요청당 최대 128k 출력 토큰을 지원하며, 가격은 $10/$50이다 (Claude API docs). 같은 문서는 Fable과 Mythos에서 adaptive thinking이 항상 켜져 있으며, thinking: {"type": "disabled"}는 지원되지 않는다고 말한다.

이 마지막 부분이 중요하다. Fable은 단순히 “Opus인데 더 똑똑한 것”이 아니다. 운영 프로필이 다르다. 더 자율적이고, 더 많이 자체 점검하며, 종종 더 오래 달린다. Anthropic은 이를 “야심 차고, 장시간 실행되며, 비동기적인 작업”을 위해 만들었다고 설명하고, 에이전트 하네스 안에서 며칠 동안 작업할 수 있다고 말한다 (Anthropic Fable page). 제품이 촘촘한 인터랙티브 턴에 의존한다면, 정확히 원하지 않는 성질이다.

병목이 실제 경과 시간이라면 Opus 4.8 Fast Mode가 더 깔끔한 대체재다. Anthropic의 Fast Mode 페이지는 Opus 4.8 Fast Mode가 2.5배 빠른 출력 토큰 속도와 “the same Opus-level model intelligence”를 갖춘 고속 구성이라고 말한다 (Claude Fast Mode). API 가격 문서는 Fast Mode Opus 4.8을 입력 $10/M, 출력 $50/M로 적고 있다 (Claude API pricing).

토큰 가격은 같다. 걸고 있는 베팅이 다를 뿐이다.

커뮤니티가 실제로 싸우는 지점

Fable 출시를 둘러싼 Hacker News 스레드는 “똑똑한가?”보다, 주도권을 잡을 수 있는 모델에게 개발자가 얼마나 많은 agency를 허용하고 싶은가에 가까웠다. 출시 토론은 읽어볼 만하다. 핵심 긴장을 잘 잡아내기 때문이다. 모델이 내가 잊은 걸 고쳐주면 능동성은 마법처럼 느껴진다. 허락 없이 범위를 넓히기로 결정하면 비싸거나 위험하게 느껴진다 (Hacker News).

Reddit은 더 실용적이었다. 한 r/ClaudeAI 벤치마크 글은 200개의 헤드리스 claude -p 세션을 돌렸고, 정가가 정확히 2배인데도 실제 사용량에서는 Fable 5가 Opus 4.8보다 2–3배 더 비싸 보였다고 보고했다. 같은 글은 흥미로운 조종 결과도 발견했다. 자체 instruction-following 측정에서 Opus 4.6은 88/90, Fable 5는 83/90, Opus 4.8은 80/90을 기록했다 (Reddit). 이건 보편적 벤치마크가 아니라 한 사용자의 하네스로 봐야 한다. 그래도 패턴은 많은 에이전트 빌더들이 보는 것과 맞아떨어진다. 비용은 요금표만이 아니다. 출력 길이, 재시도, tool call, 그리고 모델이 과하게 계획을 세우는지까지 포함한다.

또 다른 Reddit 비교는 917개의 코딩 에이전트 시나리오에서 Fable 5가 종합 92.9점과 작업당 약 $1.25를 기록했고, Opus 4.8은 92.0점과 작업당 약 $0.74를 기록했다고 보고했다. 그 벤치마크에서는 약 73%의 작업 비용 프리미엄으로 0.9점 이득을 얻은 셈이다 (Reddit). 쓸모 있는 건 정확한 점수가 아니다. 쓸모 있는 건 트레이드오프의 모양이다. Fable은 어려운 작업에서 이길 수 있다. 하지만 그 프리미엄은 해당 작업이 실제로 Opus에서 실패하거나 너무 많은 턴을 잡아먹을 때만 회수된다.

운영 측면의 실제 불만도 있다. Fable은 6월 9일 출시됐고, Anthropic은 6월 12일 미국 정부의 수출 통제 지시에 따라 Fable 5와 Mythos 5 접근을 중단한다고 게시했다 (Anthropic statement). 그래서 이번 주에 코딩 에이전트를 출시해야 한다면 “그냥 Fable을 기다리자”는 계획이 아니다.

모델 패밀리 다이어그램: 맨 아래에 Sonnet과 Haiku, 그 위에 Opus 4.8, 속도 최적화된 Opus 4.8 Fast Mode

지연 시간이 제품이라면 Opus 4.8 Fast Mode를 써라

IDE 에이전트, CI 복구 봇, 브라우저 자동화 도구, 실시간 코드 리뷰 어시스턴트를 만들고 있다면 지연 시간은 허영 지표가 아니다. 사용자의 행동을 바꾼다.

느린 에이전트는 개발자가 요청을 몰아서 던지게 만들고, 다른 탭으로 떠나게 만들고, 루프를 신뢰하지 않게 만든다. 더 빠른 에이전트는 확인을 요청하고, 테스트를 돌리고, 파일을 패치하고, 진행 상황을 스트리밍하면서도 세션이 죽은 것처럼 느껴지지 않게 한다. 이런 워크플로에서는 Fable과 동등한 토큰 가격에서 Opus 4.8 Fast Mode가 더 나은 기본값이다.

Opus 4.8 Fast Mode는 이런 경우에 써라:

작업이 인터랙티브하다. 예: “이 실패하는 테스트를 고쳐줘,” “이 스택 트레이스를 설명해줘,” “이 컴포넌트를 수정해줘,” “마이그레이션을 만들고 실행해줘.”
이미 좋은 하네스가 있다. 에이전트에 repo search, test execution, patch review, rollback이 있다면, 더 자율적인 기본 모델보다 더 빠른 턴이 더 필요할 수 있다.
예측 가능한 라우팅이 필요하다. Fable의 safety classifier는 특정 요청을 거절할 수 있고, Anthropic은 플래그된 사이버보안, 생물학, 화학, distillation 요청이 Fable에서 Opus 4.8로 라우팅될 수 있다고 말한다 (Anthropic launch post). 합리적인 안전 설계지만, 프로덕션 경로에는 또 하나의 분기가 생긴다.
에이전트에 사용자 대면 진행 마감이 있다. Fast Mode의 명시적 약속은 속도다. Fable의 약속은 야심이다.

Opus 4.8 Fast Mode의 킬러 유스케이스는 에이전트 내부 루프다:

claude -p "Run the failing test, patch the smallest fix, rerun only that test, and summarize the diff."

이 작업에는 며칠짜리 자율성이 필요 없다. 빠른 읽기, 수정, 테스트, 보고가 필요하다. 여기서 Fable 가격을 내고 더 빠른 출력의 Opus를 쓰는 건 합리적이다.

어려운 부분이 속도가 아니라 조종이라면 Fable 5를 써라

Fable은 여전히 90초짜리 코딩 턴에 들어가지 않는 지저분한 프로젝트에서 내가 쓰고 싶은 모델이다. Anthropic은 Fable의 우위가 더 길고 복잡한 작업에서 커진다고 말하며, 소프트웨어 엔지니어링, 지식 작업, 비전, 메모리, 과학 연구에서 강점을 가진다고 설명한다 (Anthropic launch post). 문서 역시 까다로운 추론과 장기 agentic 작업을 위해 만들었다고 말한다 (Claude API docs).

Fable 5는 이런 경우에 써라:

비동기로 돌릴 수 있다. 작업을 큐에 넣고, 상태를 스트리밍하고, 일하게 둔다.
작업 분해가 불분명하다. 예: 대규모 마이그레이션, 멀티 repo 리팩터링, 디자인에서 구현까지, 벤치마크 조사, 연구 종합.
모델이 자기 작업을 검증하길 원한다. Fable의 포지셔닝은 “빠른 어시스턴트”보다 “시니어 에이전트”에 가깝다.
더 빠른 턴보다 더 적은 턴이 가치 있다. Fable이 사람이 조종해야 하는 라운드 세 번을 줄여준다면, Opus Fast와 같은 $10/$50 토큰 단가는 싸게 느껴질 수 있다.

문제는 접근성이다. Anthropic의 현재 공개 페이지는 Fable을 사용할 수 없다고 말한다. 깔끔한 fallback 아키텍처는 Fable을 유일한 경로가 아니라 선택적 최상위 경로로 만드는 것이다:

interactive task -> Opus 4.8 Fast Mode
routine batch task -> Opus 4.8 standard or Sonnet
hard async task -> Fable 5 when available
flagged / refused Fable request -> Opus 4.8 fallback

OneHop이 자연스럽게 들어맞는 지점도 여기다. provider layer를 다시 만들지 않고 Fable을 시험해보는 것이 병목이라면, OneHop은 anthropic/claude-fable-5를 모델 엔드포인트로 표시하고, 일시적으로 사용할 수 없다고 표시하며, 카드 없이 신규 계정에 $10 무료 크레딧을 보여준다 (OneHop). 내가 확인한 페이지는 https://api.onehop.ai/anthropic에서 Anthropic Messages 지원을 표시했고, 공식 $10/$50 정가 대비 할인 가격도 보여줬다.

from anthropic import Anthropic

client = Anthropic(
    base_url="https://api.onehop.ai/anthropic",
    api_key="<ONEHOP_KEY>",
)

message = client.messages.create(
    model="anthropic/claude-fable-5",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Plan a safe, staged migration from Jest to Vitest."}],
)

print(message.content[0].text)

통합이 OpenAI 호환이고 OneHop 계정이 /v1 게이트웨이에 맞게 설정돼 있다면, 마이그레이션 패턴은 같은 발상이다. base URL을 https://api.onehop.ai/v1로 바꾸고, 모델 라우팅은 비즈니스 로직 밖에 두고, config로 모델 ID를 교체한다. Fable의 경우 배포 전에 라이브 OneHop 모델 페이지에서 지원 프로토콜을 확인하라.

코딩 에이전트 라우터의 아키텍처 흐름 스케치: 사용자 요청이 classifier로 들어가 Opus 4.8 Fast Mode로 분기

선택을 바꾸는 가격표

커뮤니티가 실제로 싸우는 지점

지연 시간이 제품이라면 Opus 4.8 Fast Mode를 써라

어려운 부분이 속도가 아니라 조종이라면 Fable 5를 써라

추천