Claude Fable 5 vs Opus 4.8 Fast Mode：同样的 token 价格，不同的取舍

Anthropic 无意中抛出了 2026 年 6 月最干净利落的模型选择题：如果 Claude Fable 5 的价格是每百万输入 token 10 美元、每百万输出 token 50 美元，而 Opus 4.8 Fast Mode 也是 10/50 美元，那开发者到底该跑哪一个？

这不是纸上谈兵的表格练习。截至 6 月 19 日，Anthropic 自己的 Fable 页面写着“Claude Fable 5 is currently unavailable”，并列出 $10/M 输入、$50/M 输出的价格（Anthropic）。Claude 的价格页把 Opus 4.8 标为 $5/M 输入、$25/M 输出，然后说 Fast Mode 以 2 倍标准价格提供“最高 2.5 倍更快速度”（Claude pricing）。算一下：Opus 4.8 Fast Mode 正好落在和 Fable 5 相同的 token 费率上。

这让决策更锋利了。Fable 是野心更大的模型。Opus 4.8 Fast Mode 则是当延迟很重要、访问权限不能靠运气时，你可以围绕它来设计的模型。

一张横向价格/性能图，对比 Fable 5、Opus 4.8 标准版和 Opus 4.8 Fast Mode；x 轴列出输出价格

改变选择的价格表

开发者应该从这张扎实的表开始：

Model	Availability on June 19, 2026	Input	Output	Context / output	Speed note	Best fit
Claude Fable 5	当前不可用	$10/MTok	$50/MTok	1M 上下文，最高 128k 输出	为长时间运行的 agentic 工作打造	困难、模糊、多阶段项目
Claude Opus 4.8	可用	$5/MTok	$25/MTok	标准价格下 1M 上下文	标准速度	复杂编码、企业级 agent
Claude Opus 4.8 Fast Mode	研究预览 / Claude Code 额外用量	$10/MTok	$50/MTok	与 Opus 4.8 相同的上下文规则	输出最高快 2.5 倍	对延迟敏感的 agent 循环

Fable 的规格来自 Anthropic 的 API 文档：Fable 5 默认拥有 1M-token 上下文窗口，单次请求最高支持 128k 输出 token，价格为 $10/$50（Claude API docs）。同一份文档还说，Fable 和 Mythos 始终开启 adaptive thinking，并且不支持 thinking: {"type": "disabled"}。

最后这一点很关键。Fable 不是简单的“更聪明的 Opus”。它的运行画像不同：更自主、更会自检，也往往跑得更久。Anthropic 把它描述为面向“有野心、长时间运行、异步工作”的模型，并称它可以在 agent harness 中连续工作数天（Anthropic Fable page）。如果你的产品依赖紧凑的交互轮次，这恰恰是你不想要的东西。

当瓶颈是墙钟时间时，Opus 4.8 Fast Mode 是更干净的替代品。Anthropic 的 Fast Mode 页面称 Opus 4.8 Fast Mode 是一种高速配置，输出 token 速度快 2.5 倍，并具备“同样的 Opus 级模型智能”（Claude Fast Mode）。API 价格文档列出 Fast Mode Opus 4.8 的价格为 $10/M 输入、$50/M 输出（Claude API pricing）。

同样的 token 价格。不同的赌注。

社区到底在争什么

围绕 Fable 发布的 Hacker News 讨论，与其说是在争“它聪不聪明？”，不如说是在争开发者到底想从一个会主动推进的模型那里要多少自主性。这场发布讨论值得一读，因为它框住了核心张力：当模型修好了你忘掉的东西时，主动性像魔法；当它未经允许就扩大范围时，主动性就显得昂贵，甚至危险（Hacker News）。

Reddit 上的讨论更务实。一篇 r/ClaudeAI 基准测试帖跑了 200 个无头 claude -p 会话，并报告说，Fable 5 在原始使用中看起来比 Opus 4.8 贵 2–3 倍，尽管标价正好是 2 倍。同一篇帖子还发现了一个出人意料的可控性结果：在它的指令遵循指标上，Opus 4.6 得了 88/90，Fable 5 得了 83/90，Opus 4.8 得了 80/90（Reddit）。把它当作某个用户自己的 harness，而不是放之四海皆准的基准。但这个模式和很多 agent 构建者看到的一样：成本不只是价目表。它还包括输出长度、重试、工具调用，以及模型是否过度规划。

另一篇覆盖 917 个编码 agent 场景的 Reddit 对比报告称，Fable 5 总分 92.9、每任务约 $1.25；Opus 4.8 总分 92.0、每任务约 $0.74。也就是说，在那个基准中，约 73% 的任务成本溢价换来 0.9 分提升（Reddit）。有用的不是精确分数。有用的是这笔交易的形状：Fable 可能在难题上获胜，但只有当这些任务真的在 Opus 上失败，或需要太多轮次时，这笔溢价才划算。

还有一条真实的运维挫败线索。Fable 在 6 月 9 日发布，随后 Anthropic 在 6 月 12 日发文称，在美国政府出口管制指令后，暂停 Fable 5 和 Mythos 5 的访问（Anthropic statement）。这就是为什么如果你这周要发布一个编码 agent，“等 Fable 就好”不是计划。

一张模型家族图，底部是 Sonnet 和 Haiku，上方是 Opus 4.8，Opus 4.8 Fast Mode 作为速度优化版本

当延迟就是产品时，用 Opus 4.8 Fast Mode

如果你在构建 IDE agent、CI 修复机器人、浏览器自动化工具或实时代码评审助手，延迟就不是虚荣指标。它会改变用户行为。

慢 agent 会让开发者批量提交请求、切到别的标签页，或者不再相信这个循环。更快的 agent 可以请求确认、跑测试、改文件、流式汇报进度，而不让会话像死了一样。对这些工作流来说，在 Fable 等价 token 价格下，Opus 4.8 Fast Mode 是更好的默认选择。

在这些情况下使用 Opus 4.8 Fast Mode：

任务是交互式的。例如：“修掉这个失败测试”、“解释这个 stack trace”、“编辑这个组件”、“生成一个 migration 并运行它。”
你已经有不错的 harness。如果你的 agent 具备仓库搜索、测试执行、patch 审查和回滚，你可能更需要更快的轮次，而不是一个更自主的基础模型。
你需要可预测的路由。Fable 的安全分类器可能会拒绝某些请求，而 Anthropic 表示，被标记的网络安全、生物、化学或蒸馏请求可能会从 Fable 路由到 Opus 4.8（Anthropic launch post）。这是合理的安全设计，但也是生产路径里的另一个分支。
你的 agent 有面向用户的进度时限。Fast Mode 明确承诺的是速度。Fable 承诺的是野心。

Opus 4.8 Fast Mode 的杀手级用例是 agent 内循环：

claude -p "Run the failing test, patch the smallest fix, rerun only that test, and summarize the diff."

这项工作不需要数天自主性。它需要快速读取、编辑、测试、汇报。在这里，花 Fable 的价格买输出更快的 Opus 是理性的。

当难点是可控性而不是速度时，用 Fable 5

对于那些塞不进 90 秒编码轮次的混乱项目，Fable 仍然是我想要的模型。Anthropic 说，随着任务更长、更复杂，Fable 的领先优势会扩大，并描述了它在软件工程、知识工作、视觉、记忆和科学研究方面的强项（Anthropic launch post）。它的文档也说，它是为高要求推理和长周期 agentic 工作打造的（Claude API docs）。

在这些情况下使用 Fable 5：

你可以异步运行。把任务排队，流式输出状态，让它工作。
任务拆解不清晰。例如：大型迁移、多仓库重构、从设计到实现、基准调查、研究综合。
你希望模型验证自己的工作。Fable 的定位更像“高级 agent”，而不是“快速助手”。
更少轮次比更快轮次更值钱。如果 Fable 省掉三轮人工引导，那么和 Opus Fast 相同的 $10/$50 token 费率就可能变得便宜。

问题在访问权限。Anthropic 当前公开页面说 Fable 不可用。干净的 fallback 架构，是把 Fable 做成可选的顶级路由，而不是唯一的路由：

interactive task -> Opus 4.8 Fast Mode
routine batch task -> Opus 4.8 standard or Sonnet
hard async task -> Fable 5 when available
flagged / refused Fable request -> Opus 4.8 fallback

这也是 OneHop 很自然能派上用场的地方。如果你的阻碍是想试 Fable、但不想重建 provider 层，OneHop 把 anthropic/claude-fable-5 列为一个模型端点，标注为暂时不可用，并显示新账户无需绑卡可得 $10 免费额度（OneHop）。我查看的页面列出了 https://api.onehop.ai/anthropic 上的 Anthropic Messages 支持，并显示相对于官方 $10/$50 标价的折扣价格。

from anthropic import Anthropic

client = Anthropic(
    base_url="https://api.onehop.ai/anthropic",
    api_key="<ONEHOP_KEY>",
)

message = client.messages.create(
    model="anthropic/claude-fable-5",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Plan a safe, staged migration from Jest to Vitest."}],
)

print(message.content[0].text)

如果你的集成兼容 OpenAI，并且你的 OneHop 账户已配置 /v1 gateway，迁移模式本质上也是同一个思路：把 base URL 改成 https://api.onehop.ai/v1，把模型路由留在业务逻辑之外，并通过配置切换模型 ID。对于 Fable，部署前请在实时 OneHop 模型页面确认支持的协议。

一张编码 agent 路由器架构流程草图：用户请求进入分类器，分支到 Opus 4.8 Fast Mode

建议

不要全局用 Fable 5 替换 Opus 4.8。那是昂贵又脆弱的迁移版本。

对于对延迟敏感的编码 agent，把 Opus 4.8 Fast Mode 当作 Fable 价格档的替代品。它拥有相同的 token 价格，速度承诺明确，而且避免依赖一个当前不可用的模型。等访问恢复后，再把 Fable 5 加成异步升级路径。

对于长时间运行的自主工作，等待 Fable 访问恢复，或者在上线后通过 provider 路由测试它。Fable 的理由不是“和 Opus Fast 同价”。真正的理由是“在 Opus 仍然难以完成的工作上，需要更少人工引导轮次”。如果你的任务已经能被 Opus 4.8 解决，Fast Mode 买到的是更好的用户体验。如果你的任务失败是因为模型撑不住整个计划，Fable 才是值得付费的那个。

我的默认路由规则很简单：

面向实时编码循环，用 Opus 4.8 Fast Mode 发布。
成本受控的后台任务，保留 Opus 4.8 标准版。
只有最难的异步任务，在 Fable 5 可用时才路由过去。
衡量任务成本，而不是 token 价格。

如果你想用低摩擦方式测试这套路由，可以从 Claude Fable 5 on OneHop 开始，然后领取 $10 免费额度。重点不是崇拜某个前沿模型。重点是停止把模型选择硬编码进你的 agent，并把取舍显式化。