Anthropic은 2026년 6월, 의도치 않게 가장 깔끔한 모델 선택 질문을 만들어냈다. Claude Fable 5가 입력 토큰 100만 개당 $10, 출력 토큰 100만 개당 $50이고, Opus 4.8 Fast Mode도 $10/$50이라면, 개발자는 실제로 무엇을 돌려야 할까?
이건 이론적인 스프레드시트 놀음이 아니다. 6월 19일 기준, Anthropic의 Fable 페이지는 “Claude Fable 5 is currently unavailable”이라고 말하면서 입력 $10/M, 출력 $50/M 가격을 적고 있다 (Anthropic). Claude 가격 페이지는 Opus 4.8을 입력 $5/M, 출력 $25/M로 표시한 뒤, Fast Mode가 표준 가격의 2배로 “up to 2.5x faster speeds”를 제공한다고 말한다 (Claude pricing). 계산은 간단하다. Opus 4.8 Fast Mode는 Fable 5와 같은 토큰 단가에 도착한다.
그래서 결정은 더 날카로워진다. Fable은 더 야심 찬 모델이다. Opus 4.8 Fast Mode는 지연 시간이 중요하고 접근성이 “될 수도 있고 안 될 수도”이면 안 되는 상황에서 설계의 기준으로 삼을 수 있는 모델이다.

선택을 바꾸는 가격표
개발자가 먼저 봐야 할 기준표는 이렇다:
| 모델 | 2026년 6월 19일 기준 사용 가능 여부 | 입력 | 출력 | 컨텍스트 / 출력 | 속도 메모 | 가장 잘 맞는 용도 |
|---|---|---|---|---|---|---|
| Claude Fable 5 | 현재 사용 불가 | $10/MTok | $50/MTok | 1M 컨텍스트, 최대 128k 출력 | 장시간 agentic 작업용 | 어렵고 모호한 다단계 프로젝트 |
| Claude Opus 4.8 | 사용 가능 | $5/MTok | $25/MTok | 표준 가격에서 1M 컨텍스트 | 표준 속도 | 복잡한 코딩, 엔터프라이즈 에이전트 |
| Claude Opus 4.8 Fast Mode | Research preview / Claude Code 추가 사용량 | $10/MTok | $50/MTok | Opus 4.8과 동일한 컨텍스트 규칙 | 최대 2.5배 빠른 출력 | 지연 시간에 민감한 에이전트 루프 |
Fable 사양은 Anthropic의 API 문서에서 나온다. Fable 5는 기본 1M 토큰 컨텍스트 윈도우를 갖고, 요청당 최대 128k 출력 토큰을 지원하며, 가격은 $10/$50이다 (Claude API docs). 같은 문서는 Fable과 Mythos에서 adaptive thinking이 항상 켜져 있으며, thinking: {"type": "disabled"}는 지원되지 않는다고 말한다.
이 마지막 부분이 중요하다. Fable은 단순히 “Opus인데 더 똑똑한 것”이 아니다. 운영 프로필이 다르다. 더 자율적이고, 더 많이 자체 점검하며, 종종 더 오래 달린다. Anthropic은 이를 “야심 차고, 장시간 실행되며, 비동기적인 작업”을 위해 만들었다고 설명하고, 에이전트 하네스 안에서 며칠 동안 작업할 수 있다고 말한다 (Anthropic Fable page). 제품이 촘촘한 인터랙티브 턴에 의존한다면, 정확히 원하지 않는 성질이다.
병목이 실제 경과 시간이라면 Opus 4.8 Fast Mode가 더 깔끔한 대체재다. Anthropic의 Fast Mode 페이지는 Opus 4.8 Fast Mode가 2.5배 빠른 출력 토큰 속도와 “the same Opus-level model intelligence”를 갖춘 고속 구성이라고 말한다 (Claude Fast Mode). API 가격 문서는 Fast Mode Opus 4.8을 입력 $10/M, 출력 $50/M로 적고 있다 (Claude API pricing).
토큰 가격은 같다. 걸고 있는 베팅이 다를 뿐이다.
커뮤니티가 실제로 싸우는 지점
Fable 출시를 둘러싼 Hacker News 스레드는 “똑똑한가?”보다, 주도권을 잡을 수 있는 모델에게 개발자가 얼마나 많은 agency를 허용하고 싶은가에 가까웠다. 출시 토론은 읽어볼 만하다. 핵심 긴장을 잘 잡아내기 때문이다. 모델이 내가 잊은 걸 고쳐주면 능동성은 마법처럼 느껴진다. 허락 없이 범위를 넓히기로 결정하면 비싸거나 위험하게 느껴진다 (Hacker News).
Reddit은 더 실용적이었다. 한 r/ClaudeAI 벤치마크 글은 200개의 헤드리스 claude -p 세션을 돌렸고, 정가가 정확히 2배인데도 실제 사용량에서는 Fable 5가 Opus 4.8보다 2–3배 더 비싸 보였다고 보고했다. 같은 글은 흥미로운 조종 결과도 발견했다. 자체 instruction-following 측정에서 Opus 4.6은 88/90, Fable 5는 83/90, Opus 4.8은 80/90을 기록했다 (Reddit). 이건 보편적 벤치마크가 아니라 한 사용자의 하네스로 봐야 한다. 그래도 패턴은 많은 에이전트 빌더들이 보는 것과 맞아떨어진다. 비용은 요금표만이 아니다. 출력 길이, 재시도, tool call, 그리고 모델이 과하게 계획을 세우는지까지 포함한다.
또 다른 Reddit 비교는 917개의 코딩 에이전트 시나리오에서 Fable 5가 종합 92.9점과 작업당 약 $1.25를 기록했고, Opus 4.8은 92.0점과 작업당 약 $0.74를 기록했다고 보고했다. 그 벤치마크에서는 약 73%의 작업 비용 프리미엄으로 0.9점 이득을 얻은 셈이다 (Reddit). 쓸모 있는 건 정확한 점수가 아니다. 쓸모 있는 건 트레이드오프의 모양이다. Fable은 어려운 작업에서 이길 수 있다. 하지만 그 프리미엄은 해당 작업이 실제로 Opus에서 실패하거나 너무 많은 턴을 잡아먹을 때만 회수된다.
운영 측면의 실제 불만도 있다. Fable은 6월 9일 출시됐고, Anthropic은 6월 12일 미국 정부의 수출 통제 지시에 따라 Fable 5와 Mythos 5 접근을 중단한다고 게시했다 (Anthropic statement). 그래서 이번 주에 코딩 에이전트를 출시해야 한다면 “그냥 Fable을 기다리자”는 계획이 아니다.

지연 시간이 제품이라면 Opus 4.8 Fast Mode를 써라
IDE 에이전트, CI 복구 봇, 브라우저 자동화 도구, 실시간 코드 리뷰 어시스턴트를 만들고 있다면 지연 시간은 허영 지표가 아니다. 사용자의 행동을 바꾼다.
느린 에이전트는 개발자가 요청을 몰아서 던지게 만들고, 다른 탭으로 떠나게 만들고, 루프를 신뢰하지 않게 만든다. 더 빠른 에이전트는 확인을 요청하고, 테스트를 돌리고, 파일을 패치하고, 진행 상황을 스트리밍하면서도 세션이 죽은 것처럼 느껴지지 않게 한다. 이런 워크플로에서는 Fable과 동등한 토큰 가격에서 Opus 4.8 Fast Mode가 더 나은 기본값이다.
Opus 4.8 Fast Mode는 이런 경우에 써라:
- 작업이 인터랙티브하다. 예: “이 실패하는 테스트를 고쳐줘,” “이 스택 트레이스를 설명해줘,” “이 컴포넌트를 수정해줘,” “마이그레이션을 만들고 실행해줘.”
- 이미 좋은 하네스가 있다. 에이전트에 repo search, test execution, patch review, rollback이 있다면, 더 자율적인 기본 모델보다 더 빠른 턴이 더 필요할 수 있다.
- 예측 가능한 라우팅이 필요하다. Fable의 safety classifier는 특정 요청을 거절할 수 있고, Anthropic은 플래그된 사이버보안, 생물학, 화학, distillation 요청이 Fable에서 Opus 4.8로 라우팅될 수 있다고 말한다 (Anthropic launch post). 합리적인 안전 설계지만, 프로덕션 경로에는 또 하나의 분기가 생긴다.
- 에이전트에 사용자 대면 진행 마감이 있다. Fast Mode의 명시적 약속은 속도다. Fable의 약속은 야심이다.
Opus 4.8 Fast Mode의 킬러 유스케이스는 에이전트 내부 루프다:
claude -p "Run the failing test, patch the smallest fix, rerun only that test, and summarize the diff."
이 작업에는 며칠짜리 자율성이 필요 없다. 빠른 읽기, 수정, 테스트, 보고가 필요하다. 여기서 Fable 가격을 내고 더 빠른 출력의 Opus를 쓰는 건 합리적이다.
어려운 부분이 속도가 아니라 조종이라면 Fable 5를 써라
Fable은 여전히 90초짜리 코딩 턴에 들어가지 않는 지저분한 프로젝트에서 내가 쓰고 싶은 모델이다. Anthropic은 Fable의 우위가 더 길고 복잡한 작업에서 커진다고 말하며, 소프트웨어 엔지니어링, 지식 작업, 비전, 메모리, 과학 연구에서 강점을 가진다고 설명한다 (Anthropic launch post). 문서 역시 까다로운 추론과 장기 agentic 작업을 위해 만들었다고 말한다 (Claude API docs).
Fable 5는 이런 경우에 써라:
- 비동기로 돌릴 수 있다. 작업을 큐에 넣고, 상태를 스트리밍하고, 일하게 둔다.
- 작업 분해가 불분명하다. 예: 대규모 마이그레이션, 멀티 repo 리팩터링, 디자인에서 구현까지, 벤치마크 조사, 연구 종합.
- 모델이 자기 작업을 검증하길 원한다. Fable의 포지셔닝은 “빠른 어시스턴트”보다 “시니어 에이전트”에 가깝다.
- 더 빠른 턴보다 더 적은 턴이 가치 있다. Fable이 사람이 조종해야 하는 라운드 세 번을 줄여준다면, Opus Fast와 같은 $10/$50 토큰 단가는 싸게 느껴질 수 있다.
문제는 접근성이다. Anthropic의 현재 공개 페이지는 Fable을 사용할 수 없다고 말한다. 깔끔한 fallback 아키텍처는 Fable을 유일한 경로가 아니라 선택적 최상위 경로로 만드는 것이다:
interactive task -> Opus 4.8 Fast Mode
routine batch task -> Opus 4.8 standard or Sonnet
hard async task -> Fable 5 when available
flagged / refused Fable request -> Opus 4.8 fallback
OneHop이 자연스럽게 들어맞는 지점도 여기다. provider layer를 다시 만들지 않고 Fable을 시험해보는 것이 병목이라면, OneHop은 anthropic/claude-fable-5를 모델 엔드포인트로 표시하고, 일시적으로 사용할 수 없다고 표시하며, 카드 없이 신규 계정에 $10 무료 크레딧을 보여준다 (OneHop). 내가 확인한 페이지는 https://api.onehop.ai/anthropic에서 Anthropic Messages 지원을 표시했고, 공식 $10/$50 정가 대비 할인 가격도 보여줬다.
from anthropic import Anthropic
client = Anthropic(
base_url="https://api.onehop.ai/anthropic",
api_key="<ONEHOP_KEY>",
)
message = client.messages.create(
model="anthropic/claude-fable-5",
max_tokens=1024,
messages=[{"role": "user", "content": "Plan a safe, staged migration from Jest to Vitest."}],
)
print(message.content[0].text)
통합이 OpenAI 호환이고 OneHop 계정이 /v1 게이트웨이에 맞게 설정돼 있다면, 마이그레이션 패턴은 같은 발상이다. base URL을 https://api.onehop.ai/v1로 바꾸고, 모델 라우팅은 비즈니스 로직 밖에 두고, config로 모델 ID를 교체한다. Fable의 경우 배포 전에 라이브 OneHop 모델 페이지에서 지원 프로토콜을 확인하라.

추천
Opus 4.8을 Fable 5로 전역 교체하지 마라. 그건 비싸고 취약한 버전의 마이그레이션이다.
지연 시간에 민감한 코딩 에이전트라면, Fable 가격의 대체재로 Opus 4.8 Fast Mode를 써라. 토큰 가격은 같고, 속도 약속은 명시적이며, 현재 사용할 수 없는 모델에 의존하지 않아도 된다. Fable 5는 접근이 돌아왔을 때 비동기 escalation 경로로 추가하라.
장시간 자율 작업이라면 Fable 접근을 기다리거나, 라이브가 되면 provider 경로를 통해 테스트하라. Fable을 쓰는 이유는 “Opus Fast와 같은 가격”이 아니다. 이유는 “Opus가 여전히 끝내기 버거워하는 작업에서 조종 턴을 줄이는 것”이다. 작업이 이미 Opus 4.8로 해결된다면 Fast Mode는 더 나은 사용자 경험을 사준다. 작업이 모델이 전체 계획을 붙들지 못해서 실패한다면, Fable이 돈을 낼 만한 쪽이다.
내 기본 라우팅 규칙은 단순하다:
- 실시간 코딩 루프는 Opus 4.8 Fast Mode로 출시한다.
- 비용 통제형 백그라운드 작업에는 Opus 4.8 standard를 유지한다.
- 가장 어려운 비동기 작업만 Fable 5가 사용 가능할 때 라우팅한다.
- 토큰 가격이 아니라 작업 비용을 측정한다.
그 라우팅을 낮은 마찰로 테스트하고 싶다면 Claude Fable 5 on OneHop에서 시작한 다음, $10 무료로 시작하면 된다. 핵심은 frontier 모델을 숭배하는 게 아니다. 핵심은 에이전트 안에 모델 선택을 하드코딩하지 말고, 트레이드오프를 명시적으로 만드는 것이다.