← 全部文章
News

Claude Fable 5 使用分类器,将部分网络、生物和蒸馏请求路由到 Opus 4.8

A cream-background editorial diagram showing Claude Fable 5 as a central routing node, with three terracotta classifier

Claude Fable 5 已于 2026 年 6 月 9 日正式全面可用,但它并不会回答你发给它的每一个请求。Anthropic 表示,一些被新安全机制标记为涉及网络安全、生物与化学,或蒸馏的请求,会自动改由 Claude Opus 4.8 处理;早期数据显示,超过 95% 的 Fable 会话完全不会触发 fallback(Anthropic)。

这个实现细节,比发布标题本身更重要。如果你在调试一个 agent、跑 eval,或比较模型质量,那么“我调用了 Fable 5”已经不再总是等于“Fable 5 给出了回答”。有时产品界面,或者你配置过的 API 集成,会把请求路由到 Opus 4.8。

一张与封面风格一致的模型家族示意图,展示 Fable 5 和 Mythos 5 共享同一个底层模型模块,其中 Fable p

Anthropic 到底发布了什么

Anthropic 在 6 月 9 日发布了两个相关模型:Claude Fable 5 和 Claude Mythos 5。Fable 5 是全面可用版本。Mythos 5 则受限开放,最初面向 Project Glasswing 合作伙伴,之后再扩展到部分受信访问计划(Anthropic)。

该公司把 Fable 5 描述为一个面向通用使用做了安全化处理的“Mythos-class”模型。它的产品页把它定位于长时间运行的编码任务、agentic 工作、企业流程,以及大量视觉文档任务(Anthropic)。API 文档将 claude-fable-5 列为 Anthropic 已广泛发布模型中能力最强的一个,拥有 1M token 上下文窗口、128k 最大输出、始终开启的自适应思考,并按每百万输入 token 10 美元、每百万输出 token 50 美元计费(Claude API docs)。

开发者需要掌握的模型图景可以压缩成这样:

模型API ID可用性上下文最大输出每 1M token 价格
Claude Fable 5claude-fable-5全面可用1M128k输入 $10 / 输出 $50
Claude Mythos 5claude-mythos-5受限,Project Glasswing 和受信访问1M128k输入 $10 / 输出 $50
Claude Opus 4.8claude-opus-4-8全面可用Claude API、Bedrock、Vertex AI 上为 1M128k输入 $5 / 输出 $25

关键差异不只是能力。更重要的是策略边界。Fable 5 是带有额外安全机制的公开模型。根据 Anthropic 的发布文章,Mythos 5 使用相同底层模型,但对获批用户移除了一部分安全限制(Anthropic)。

Fallback 路径

Anthropic 表示,Fable 5 使用了一组新的分类器,也就是独立的 AI 系统,用来检测潜在滥用和越狱尝试。当这些分类器检测到请求与网络安全、生物与化学,或蒸馏相关时,响应会自动改由 Claude Opus 4.8 处理(Anthropic)。

Help Center 给出了同一行为更偏产品层面的解释。Fable 5 会对每个请求运行自动安全检查。这些检查旨在拦截若干领域,包括进攻性网络安全技术、生物与生命科学查询、提取摘要化思考内容,以及一小部分前沿 LLM 开发任务,比如分布式训练基础设施,以及部分加速器或内核相关工作(Claude Help Center)。

该页面还说明,检查的不只是最新一条消息。记忆、connector 内容、网页结果和文件都可能触发拦截。这是一个调试陷阱。用户也许只是问了一个无害的追问,但对话中之前粘贴过的漏洞利用文章、实验室流程,或模型训练笔记,都可能踩中分类器。

在 Claude 的消费者和工作区产品界面中,选择 Fable 5 时会默认启用自动切换。如果某一轮被切换,用户会看到提示,回答也会标注实际响应的模型。切换后,该对话接下来的模型选择器会停留在 Opus 4.8,除非用户手动切回(Claude Help Center)。

一张从左到右的请求流程草图:用户提示和文件进入 Fable 5 分类器检查,安全请求进入 Fable r

为什么开发者会明显感受到

fallback 会制造出一类新的“模型行为”bug。

第一,eval 可能变成混合模型 eval。如果你的测试集包含漏洞分析、安全加固、合成生物学、化学、医学研究,或模型蒸馏提示,其中一些行可能会由 Opus 4.8 回答。如果你的 harness 只记录请求的模型,你就会把结果归因错。

第二,agent trace 可能看起来前后不一致。Fable 5 可能负责规划、代码修改和重构,然后 Opus 4.8 又在某个被标记的安全审查轮次中接手回答。如果 agent 使用 subagent,那么每一次 subagent 调用都需要在 API 中配置自己的 fallback。Anthropic 的 cookbook 提醒,API fallback 没有账号级或会话级开关。每个请求都必须包含 fallback 设置(Claude Cookbook)。

第三,计费需要更细的埋点。Anthropic 的 Help Center 表示,如果请求在 Fable 产生输出之前就被拦截,则只按 Opus 费率计费。如果请求在流式输出中途被拦截,输入 token 和已经流出的 token 按 Fable 费率计费,剩余部分按 Opus 费率计费(Claude Help Center)。

对 API 用户来说,服务端 fallback 路径看起来是这样:

curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: server-side-fallback-2026-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-fable-5",
    "max_tokens": 1024,
    "fallbacks": [{ "model": "claude-opus-4-8" }],
    "messages": [{ "role": "user", "content": "Hello, world" }]
  }'

真正的生产建议是:同时记录 requested_modelresponse_model。也要记录 stop reasons、暴露出来的 fallback categories、响应是否为流式,以及请求是否由 subagent 或 retry 路径构造。

安全敏感工作流需要单独评估

Fable 5 可能是长周期编码和知识工作的合适默认选项。但它不会自动成为所有提到安全、生物、化学、医疗健康或模型训练的工作流的正确默认选项。

Anthropic 明确表示,这些安全机制偏保守,可能拦截无害请求。发布文章称,公司这样调校是为了“既安全又快速”地发布模型,并且在 Anthropic 继续收窄边界的过程中,误报是预期之内的(Anthropic)。Help Center 给出了一些可能被拦截的合法工作示例,包括授权安全测试、良性生物研究、生物技术商业文档、医学影像与诊断、临床问题,以及基础生物教育(Claude Help Center)。

这意味着你的 eval suite 至少应该拆成三个桶:

  1. Fable 应该直接回答的普通产品流量。
  2. 预期会触发 fallback 且可以接受的双用途或敏感流量。
  3. 请求本身无害、但很可能触碰分类器边界的误报探针。

不要把它们混在一起求平均,然后称之为“Fable 5 质量”。对每个桶,分别跟踪回答质量、fallback 率、延迟、拒答率、成本,以及用户可见提示。如果你在为生物技术客户运行支持机器人,3% 的 fallback 率可能很正常。如果你在为前端迁移运行编码助手,3% 可能意味着你的提示模板意外把安全或模型提取相关语言拖进了上下文。

一个紧凑的评估仪表盘模型图,三列分别标为普通流量、敏感流量和误报 p

数据保留变更也是故事的一部分

Fable 5 还为部分企业客户带来了数据保留变更。Anthropic 表示,自 2026 年 6 月 9 日起,在所有提供 Mythos-class 模型的平台上,Mythos-class 模型的提示和输出都会出于信任与安全目的保留 30 天(Claude Help Center)。

这对之前使用零数据保留的组织影响最大。Anthropic 表示,该变更适用于 Claude Console 中的 ZDR 工作区、Claude Enterprise 中带 ZDR 的 Claude Code,以及通过 AWS Bedrock、Google Cloud Agent Platform 或 Microsoft Foundry 使用 ZDR 的访问方式。其他模型不受这项特定政策影响(Claude Help Center)。

对开发者来说,这会变成一个架构问题,而不是法律脚注。在 Fable 5 进入生产路径之前,你可能需要单独的工作区、沙盒组织,或特定 provider 的保留配置。如果你的数据分级规则禁止 30 天保留,那么在安全和法务团队批准设置之前,先使用其他模型。

什么时候 Fable 5 是正确模型

当任务受益于持久性、长上下文和高自主性时,使用 Fable 5:大型迁移、多步骤重构、复杂文档推理、重视觉分析,或需要自行规划并测试工作的 agent。Anthropic 自己的定位也指向“持续数天”和异步任务,而不是廉价的大批量补全(Anthropic)。

当任务靠近分类器边界时,要更谨慎。安全 copilots、生物研究助手、化学搜索工具、模型训练平台和 eval harness,都应该把 fallback 当作预期状态。把 UI 和日志设计成用户能看清到底是哪个模型回答的。把测试设计成能暴露“fallback 率变化”,而不是把它伪装成神秘的质量漂移。

这次发布仍然很重要。Anthropic 让一个 Mythos-class 模型全面可用,带来了公开定价、API 访问,以及有文档说明的 fallback 路径。但对开发者来说,运营层面的结论很简单:Fable 5 是一个会路由的系统。如果你像发布单一静态模型那样发布它,你的 trace、eval 和账单迟早会和现实对不上。

如果你想自己试试 Claude Fable 5,可以通过一个可直接替换的端点使用 OneHop 上的 Claude Fable 5,价格大约比标价低 30%。新账号可以从 10 美元免费额度开始,无需绑卡。

延伸阅读:Claude Fable 5 入门