Claude Fable 5는 일부 사이버, 바이오, 증류 요청을 Opus 4.8로 라우팅하는 분류기를 쓴다

Claude Fable 5는 2026년 6월 9일부터 정식 제공되지만, 사용자가 보내는 모든 요청에 직접 답하지는 않는다. Anthropic에 따르면 사이버보안, 생물학과 화학, 또는 증류 영역에서 새 안전장치에 의해 플래그가 지정된 일부 요청은 자동으로 Claude Opus 4.8이 처리한다. 초기 데이터상 Fable 세션의 95% 이상은 fallback이 전혀 발생하지 않는다 (Anthropic).

이 구현 디테일 하나가 출시 헤드라인보다 더 중요하다. 에이전트를 디버깅하거나, eval을 돌리거나, 모델 품질을 비교하고 있다면 “Fable 5를 호출했다”가 더 이상 항상 “Fable 5가 답했다”와 같은 뜻이 아니다. 어떤 경우에는 제품 화면에서, 또는 그렇게 설정한 API 통합에서, 요청이 Opus 4.8로 라우팅된다.

Fable 5와 Mythos 5가 같은 기반 모델 블록을 공유하고 Fable p가 표시된 커버와 맞춘 모델 패밀리 다이어그램

Anthropic이 실제로 내놓은 것

Anthropic은 6월 9일 두 개의 관련 모델, Claude Fable 5와 Claude Mythos 5를 출시했다. Fable 5는 정식 제공 버전이다. Mythos 5는 제한적으로 제공되며, 초기에는 Project Glasswing 파트너에게, 이후에는 선별된 trusted-access 프로그램에 제공된다 (Anthropic).

회사는 Fable 5를 일반 사용에 안전하게 만든 “Mythos-class” 모델이라고 설명한다. 제품 페이지에서는 장시간 코딩, agentic 작업, 엔터프라이즈 워크플로, 비전 중심 문서 작업에 적합하다고 소개한다 (Anthropic). API 문서에는 claude-fable-5가 Anthropic이 널리 출시한 모델 중 가장 유능한 모델로 올라와 있으며, 1M 토큰 컨텍스트 창, 128k 최대 출력, 항상 켜져 있는 adaptive thinking, 그리고 입력 토큰 100만 개당 $10, 출력 토큰 100만 개당 $50의 가격을 제공한다 (Claude API docs).

개발자가 알아야 할 모델 그림은 간단하다.

모델	API ID	제공 범위	컨텍스트	최대 출력	1M 토큰당 가격
Claude Fable 5	`claude-fable-5`	정식 제공	1M	128k	입력 $10 / 출력 $50
Claude Mythos 5	`claude-mythos-5`	제한 제공, Project Glasswing 및 trusted access	1M	128k	입력 $10 / 출력 $50
Claude Opus 4.8	`claude-opus-4-8`	정식 제공	Claude API, Bedrock, Vertex AI에서 1M	128k	입력 $5 / 출력 $25

중요한 차이는 단순히 성능이 아니다. 정책 표면이다. Anthropic의 출시 글에 따르면 Fable 5는 추가 안전장치가 붙은 공개 모델이고, Mythos 5는 승인된 사용자를 위해 일부 안전장치를 해제한 같은 기반 모델이다 (Anthropic).

Fallback 경로

Anthropic은 Fable 5가 새로운 분류기 세트를 사용한다고 말한다. 잠재적 오용과 jailbreak 시도를 감지하는 별도의 AI 시스템들이다. 이 분류기가 사이버보안, 생물학과 화학, 또는 증류와 관련된 요청을 감지하면, 응답은 자동으로 Claude Opus 4.8이 대신 처리한다 (Anthropic).

Help Center는 같은 동작을 제품 관점에서 조금 더 풀어 설명한다. Fable 5는 모든 요청에 자동 안전성 검사를 실행한다. 이 검사는 공격적 사이버보안 기법, 생물학 및 생명과학 질의, 요약된 thinking 추출, 분산 학습 인프라와 일부 accelerator 또는 kernel 작업 같은 좁은 범위의 frontier LLM 개발 작업 등을 차단하기 위한 것이다 (Claude Help Center).

이 페이지는 또 검사가 최신 메시지만 보는 것이 아니라고 말한다. Memory, connector 콘텐츠, 웹 결과, 파일도 모두 차단을 유발할 수 있다. 이것이 디버깅 함정이다. 사용자는 무해한 후속 질문을 했을 수 있지만, 대화 앞부분에 붙여 넣은 exploit 분석문, 실험실 프로토콜, 모델 학습 메모가 분류기를 건드릴 수 있다.

Claude의 소비자 및 워크스페이스 화면에서는 Fable 5를 선택하면 자동 전환이 기본으로 켜져 있다. 어떤 턴이 전환되면 사용자는 알림을 보고, 답변에는 응답한 모델이 표시된다. 전환 후에는 사용자가 다시 바꾸지 않는 한 그 대화의 나머지 동안 모델 선택기가 Opus 4.8에 머문다 (Claude Help Center).

사용자 프롬프트와 파일이 Fable 5 분류기 검사로 들어가고, 안전한 요청은 Fable r로 가는 왼쪽에서 오른쪽으로 흐르는 요청 플로 스케치

개발자가 체감하게 될 이유

Fallback은 새로운 종류의 “모델 동작” 버그를 만든다.

첫째, eval이 혼합 모델 eval이 될 수 있다. 테스트 세트에 취약점 분석, 보안 강화, 합성생물학, 화학, 의학 연구, 모델 증류 프롬프트가 포함되어 있다면 일부 행은 Opus 4.8이 답할 수 있다. 하네스가 요청한 모델만 기록한다면 결과의 원인을 잘못 돌리게 된다.

둘째, 에이전트 trace가 일관되지 않아 보일 수 있다. Fable 5가 계획, 코드 수정, 리팩터링을 처리하다가, 플래그가 지정된 보안 리뷰 턴은 Opus 4.8이 답할 수 있다. 에이전트가 subagent를 쓴다면 모든 subagent 호출에 API fallback 설정이 각각 필요하다. Anthropic의 cookbook은 API fallback에 계정 수준이나 세션 수준 스위치가 없다고 경고한다. 각 요청마다 fallback 설정을 포함해야 한다 (Claude Cookbook).

셋째, 과금은 더 촘촘한 계측이 필요하다. Anthropic의 Help Center에 따르면 Fable이 출력을 만들기 전에 차단된 요청은 Opus 요금만 부과된다. 요청이 스트리밍 중간에 차단되면 입력과 이미 스트리밍된 토큰은 Fable 요금으로, 나머지는 Opus 요금으로 부과된다 (Claude Help Center).

API 사용자의 서버 측 fallback 경로는 이렇게 생겼다.

curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: server-side-fallback-2026-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-fable-5",
    "max_tokens": 1024,
    "fallbacks": [{ "model": "claude-opus-4-8" }],
    "messages": [{ "role": "user", "content": "Hello, world" }]
  }'

진짜 프로덕션 조언은 이렇다. requested_model과 response_model을 모두 로그로 남겨라. stop reason, 노출되는 경우 fallback category, 응답이 스트리밍되었는지, subagent나 retry 경로가 요청을 만들었는지도 함께 기록하라.

안전 민감 워크플로에는 별도 eval이 필요하다

Fable 5는 장기 코딩과 지식 작업의 좋은 기본값일 수 있다. 하지만 보안, 생물학, 화학, 헬스케어, 모델 학습을 언급하는 모든 워크플로에 자동으로 맞는 기본값은 아니다.

Anthropic은 안전장치가 보수적이며 무해한 요청도 잡을 수 있다고 분명히 말한다. 출시 글은 회사가 모델을 “안전하면서도 빠르게” 출시하기 위해 이렇게 조정했으며, Anthropic이 오탐을 줄이는 동안 false positive가 예상된다고 말한다 (Anthropic). Help Center는 합법적인 작업이 차단될 수 있는 예로 승인된 보안 테스트, 무해한 생물학 연구, 바이오테크 비즈니스 문서, 의료 영상과 진단, 임상 질문, 기초 생물학 교육을 든다 (Claude Help Center).

즉 eval suite는 최소한 세 버킷으로 나뉘어야 한다.

Fable이 직접 답해야 하는 일반 제품 트래픽.
Fallback이 예상되고 허용 가능한 dual-use 또는 민감 트래픽.
요청은 무해하지만 분류기 경계에 닿을 가능성이 큰 false-positive probe.

이 셋을 평균 내고 “Fable 5 품질”이라고 부르지 마라. 각 버킷마다 답변 품질, fallback 비율, 지연 시간, 거절률, 비용, 사용자에게 보이는 메시지를 추적하라. 바이오테크 고객용 support bot을 운영한다면 3% fallback 비율은 정상일 수 있다. 프론트엔드 마이그레이션용 코딩 어시스턴트를 운영하는데 3%가 나온다면, 프롬프트 템플릿이 실수로 보안 또는 모델 추출 언어를 컨텍스트에 끌고 들어오고 있다는 뜻일 수 있다.

normal traffic, sensitive traffic, false-positive p라는 세 열이 있는 컴팩트한 평가 대시보드 목업

보존 정책 변경도 이야기의 일부다

Fable 5에는 일부 비즈니스 고객을 위한 데이터 보존 변경도 함께 들어간다. Anthropic은 Mythos-class 모델의 프롬프트와 출력이 해당 모델이 제공되는 모든 플랫폼에서 trust and safety 목적으로 30일간 보존되며, 이는 2026년 6월 9일부터 적용된다고 말한다 (Claude Help Center).

이는 이전에 zero data retention을 사용하던 조직에 가장 중요하다. Anthropic에 따르면 이 변경은 Claude Console의 ZDR 워크스페이스, Claude Enterprise에서 ZDR을 사용하는 Claude Code, 그리고 ZDR이 적용된 AWS Bedrock, Google Cloud Agent Platform, Microsoft Foundry 경유 접근에 적용된다. 다른 모델은 이 특정 정책의 영향을 받지 않는다 (Claude Help Center).

개발자에게 이것은 법무 각주가 아니라 아키텍처 문제다. Fable 5를 프로덕션 경로에 넣기 전에 별도 워크스페이스, sandbox org, 또는 제공업체별 보존 설정이 필요할 수 있다. 데이터 분류 규칙이 30일 보존을 금지한다면, 보안팀과 법무팀이 구성을 승인할 때까지 다른 모델을 써라.

Fable 5가 맞는 모델인 경우

지속성, 긴 컨텍스트, 높은 자율성이 필요한 작업에는 Fable 5를 써라. 대규모 마이그레이션, 다단계 리팩터링, 복잡한 문서 추론, 비전 중심 분석, 또는 스스로 계획하고 테스트해야 하는 에이전트가 여기에 해당한다. Anthropic의 포지셔닝 자체도 저렴한 대량 completion보다는 “수일간” 이어지는 비동기 작업을 가리킨다 (Anthropic).

작업이 분류기 경계 근처에 있다면 더 조심해야 한다. 보안 copilot, 생물학 연구 어시스턴트, 화학 검색 도구, 모델 학습 플랫폼, eval 하네스는 fallback을 예상 가능한 상태로 다뤄야 한다. 사용자가 어떤 모델이 답했는지 볼 수 있도록 UI와 로그를 만들어라. 회귀가 미스터리한 품질 저하가 아니라 “fallback 비율 변화”로 드러나도록 테스트를 만들어라.

이번 출시는 여전히 큰 사건이다. Anthropic은 Mythos-class 모델을 정식 제공했고, 공개 가격, API 접근, 문서화된 fallback 경로까지 내놓았다. 하지만 개발자에게 운영상의 결론은 단순하다. Fable 5는 라우팅되는 시스템이다. 단일 정적 모델처럼 배포하면, 결국 trace와 eval과 청구서가 현실과 어긋나게 된다.

Claude Fable 5를 직접 써보고 싶다면, 드롭인 엔드포인트로 OneHop의 Claude Fable 5를 이용할 수 있다. 정가보다 약 30% 낮다. 신규 계정은 카드 없이 $10 무료 크레딧으로 시작할 수 있다.

더 읽어보기: Claude Fable 5 시작하기.