Claude Fable 5, Opus 4.8 ve Sonnet 4.6’yı göreve ve bütçeye göre nasıl yönlendirirsiniz

Anthropic, sınır seviye otonomiye net bir fiyat etiketi yapıştırdı: Claude Fable 5, Claude API üzerinde milyon giriş token’ı başına 10 dolar ve milyon çıkış token’ı başına 50 dolar olarak listeleniyor; Sonnet 4.6 3/15 dolar, Opus 4.8 ise 5/25 dolar (Fable, Sonnet, Opus). Ürün kararının tamamı bu makasta yatıyor.

Her kodlama prompt’unu Fable’a gönderiyorsanız “frontier” davranmıyorsunuz. Mimariliği pas geçiyorsunuz.

16 Haziran 2026 itibarıyla bir de erişilebilirlik pürüzü var: Anthropic’in Fable sayfası Fable 5’in şu anda kullanılamadığını söylüyor ve Anthropic, Fable 5 ile Mythos 5’i kapsayan bir ABD hükümeti direktifinin ardından 12 Haziran’da erişimi askıya aldığını belirtiyor (Anthropic açıklaması). Bu, yönlendirme katmanını daha az işe yarar yapmıyor. Daha acil hale getiriyor. Uygulamanız, bir mühendisi uyandırmadan Fable’dan Opus’a ya da Sonnet’e nasıl düşeceğini zaten bilmelidir.

Bu rehber o katmanı kuruyor: varsayılan olarak Sonnet, yüksek riskli üretim işleri için Opus, yalnızca doğru sonucun değeri token faturasını geçtiğinde uzun soluklu ajan işleri için Fable.

Sonnet 4.6, Opus 4.8 ve Fable 5 için üç dikey çubuk içeren kapak tarzı fiyat ve yetenek karşılaştırma grafiği; y ekseni

Yönlendirme Kuralı: Fable Varsayılan Değil, Uzmandır

Kör bir tabloyla başlayın.

Model	API model ID	Giriş / çıkış fiyatı	Ne için kullanılır
Claude Sonnet 4.6	`claude-sonnet-4-6`	1M token başına $3 / $15	rutin kodlama, inceleme, destek, çıkarım, çoğu ajan
Claude Opus 4.8	`claude-opus-4-8`	1M token başına $5 / $25	üretim kalitesinde kod, karmaşık incelemeler, muhakeme gerektiren ajan adımları
Claude Fable 5	`claude-fable-5`	1M token başına $10 / $50	gerçek getirisi olan, uzun soluklu, yüksek değerli ajan işleri

Anthropic’in kendi konumlandırması da bu ayrıma oturuyor. Sonnet 4.6; kodlama, ajanlar ve profesyonel iş akışları için çok yönlü günlük model olarak sunuluyor ve şu anda API beta’da 1M token’lık bağlam penceresine sahip (Anthropic Sonnet). Opus 4.8 ciddi kodlama, ajan tabanlı iş akışları ve yüksek riskli kurumsal görevler için konumlandırılıyor (Anthropic Opus). Fable 5 ise aşamalara yayılan plan yapabilen, işi devredebilen ve kendi çalışmasını denetleyebilen iddialı, uzun soluklu projeler ve ajanlar için Mythos seviyesinde bir model olarak tarif ediliyor (Anthropic Fable).

Bu size temiz bir politika verir:

Varsayılan olarak Sonnet kullanın. Çoğu prompt, $50/M çıkış modelini hak etmez.
Hata pahalıysa Opus’a yükseltin. Şema migrasyonları, güvenlik hassasiyeti olan PR incelemeleri, finansal analiz ve çok dosyalı refactor’lar gibi düşünün.
Fable’ı yalnızca görev büyük, belirsiz ve daha yüksek faturaya değerse kullanın. Çok günlük ajan çalışmaları, kod tabanı modernizasyonu, derin araştırma paketleri ve “bu projeyi bitir” iş akışları.

Topluluk tartışması çoğunlukla üçüncü kovayla ilgili. Anthropic’in 12 Haziran askıya alma kararına dair HN başlığı, indekslenmiş HN özetlerine göre binden fazla yorum aldı; tartışma kısa sürede güvenlik, jeopolitik ve bu fiyatlarla ajan kullanımını kimin karşılayabileceği eksenlerine bölündü (HN başlığı, özet referansı). Reddit başlıkları daha direkt idi: geliştiriciler token açlığı çeken Claude Code oturumlarından, abonelik kotalarından ve $50/M çıkış fiyatının Fable’ı yalnızca kurumsal alana itip itmediğinden şikâyet etti (ClaudeCode tartışması, ChatGPT subreddit tartışması).

Çoğu başlıkta eksik olan pratik cevap şu: tek bir küresel “en iyi model” üzerine tartışmayın. Beklenen değere göre yönlendirin.

Adım 1: OneHop’u Tak-Çalıştır Erişim Katmanı Olarak Kullanın

En kısa yolu istiyorsanız sağlayıcı katmanı olarak OneHop’u kullanın ve uygulama kodunuzu sağlayıcıdan bağımsız tutun. OneHop’un Fable sayfası anthropic/claude-fable-5 modelini listeliyor, resmi fiyatlandırmayı OneHop fiyatlandırmasının yanında gösteriyor ve yeni hesaplara kart gerektirmeden 10 dolar ücretsiz kredi verildiğini söylüyor (OneHop Fable 5). Güncel sayfa, Anthropic Messages desteğini https://api.onehop.ai/anthropic adresinde listeliyor; Anthropic SDK için bunu kullanın.

SDK’yı kurun:

pip install anthropic
export ONEHOP_API_KEY="your_key_here"

Minimal çağrı:

from anthropic import Anthropic

client = Anthropic(
    api_key=os.environ["ONEHOP_API_KEY"],
    base_url="https://api.onehop.ai/anthropic",
)

message = client.messages.create(
    model="anthropic/claude-fable-5",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Plan a safe Rails 6 to Rails 8 migration."}],
)

print(message.content[0].text)

Entegrasyon noktası bu. Yönlendirme katmanınız bunun üzerinde durmalı ve hangi model string’inin gönderileceğine karar vermeli.

OneHop’un buradaki değeri en iyi anlamıyla sıkıcı: tek hesap, net bir model sayfası ve uygulamanızı yeniden yazmak yerine bir base URL değişikliği. Fable duraklatılırsa ya da kullanılamazsa aynı router üst seviye görevleri Opus’a yönlendirebilir ve ürünü ayakta tutabilir.

Sadece erişim ve kredi istiyorsanız buradan başlayın: OneHop üzerinde Claude Fable 5, sonra 10 dolar ücretsiz krediyle başlayın.

Adım 2: Bütçe Bilinçli Bir Router Kurun

Aşağıda çalıştırabileceğiniz kompakt bir Python router var. İstek maliyetini tahmin eder, çağrı başına limit uygular, Fable kullanılamadığında geri düşer ve Sonnet’i varsayılan tutar.

import os
from dataclasses import dataclass
from anthropic import Anthropic, APIError, RateLimitError

PRICES = {
    "sonnet": {"model": "claude-sonnet-4-6", "in": 3.00, "out": 15.00},
    "opus": {"model": "claude-opus-4-8", "in": 5.00, "out": 25.00},
    "fable": {"model": "anthropic/claude-fable-5", "in": 10.00, "out": 50.00},
}

@dataclass
class Task:
    kind: str
    prompt: str
    max_output_tokens: int = 2000
    budget_usd: float = 0.25
    high_value: bool = False
    long_running: bool = False
    production_risk: bool = False

def rough_tokens(text: str) -> int:
    return max(1, len(text) // 4)

def estimate_cost_usd(model_key: str, input_tokens: int, output_tokens: int) -> float:
    price = PRICES[model_key]
    return (input_tokens / 1_000_000 * price["in"]) + (output_tokens / 1_000_000 * price["out"])

def choose_model(task: Task) -> str:
    if task.high_value and task.long_running:
        return "fable"
    if task.production_risk or task.kind in {"migration", "security_review", "architecture"}:
        return "opus"
    return "sonnet"

def route_with_budget(task: Task) -> list[str]:
    first = choose_model(task)
    fallbacks = {
        "fable": ["fable", "opus", "sonnet"],
        "opus": ["opus", "sonnet"],
        "sonnet": ["sonnet"],
    }[first]

    input_tokens = rough_tokens(task.prompt)
    return [
        key for key in fallbacks
        if estimate_cost_usd(key, input_tokens, task.max_output_tokens) <= task.budget_usd
    ] or ["sonnet"]

def run(task: Task) -> str:
    client = Anthropic(
        api_key=os.environ["ONEHOP_API_KEY"],
        base_url="https://api.onehop.ai/anthropic",
    )

    last_error = None
    for key in route_with_budget(task):
        try:
            response = client.messages.create(
                model=PRICES[key]["model"],
                max_tokens=task.max_output_tokens,
                messages=[{"role": "user", "content": task.prompt}],
            )
            return response.content[0].text
        except (APIError, RateLimitError) as exc:
            last_error = exc
            continue

    raise RuntimeError(f"All model routes failed: {last_error}")

if __name__ == "__main__":
    task = Task(
        kind="migration",
        prompt="Create a step-by-step plan to migrate a 200k-line Django app from 3.2 to 5.x.",
        max_output_tokens=3000,
        budget_usd=0.20,
        production_risk=True,
    )
    print(run(task))

Önemli kısım token tahminleyicisi değil. Politika sınırı. Kod tabanınızda ürünün şu cümleyi kurduğu bir yere ihtiyacınız var: “Sonuç önemli olduğu için bu görevin daha fazla harcamasına izin var.”

Uygulama isteğinin bir router’a girdiğini, ardından görev türü, es etiketli politika kontrollerinden geçtiğini gösteren mimari akış çizimi

Adım 3: Gerçek Ajan Davranışına Uyan Limitler Ekleyin

Ajan maliyetleri sıçramalıdır. Bir chat completion’ı fiyatlamak kolaydır. Bir kodlama ajanı dosyaları inceleyebilir, araç çağırabilir, yeniden yazabilir, test edebilir, tekrar deneyebilir ve özetleyebilir. Bir Reddit başlığı, bir Fable çalışmasının bir saat içinde milyonlarca token yaktığını iddia etti; bunu anekdot olarak görün, ama kalıp yeterince gerçek: uzun ufuklu ajanlar döngüler üzerinden token kullanımını katlar (Reddit).

Üç limit ekleyin:

Çağrı başına limit: tahmini maliyet istek bütçesini aşıyorsa reddedin ya da daha düşük modele geçin.
Görev başına limit: tekil çağrılar geçerli olsa bile ajanı dolar limiti dolunca durdurun.
Kullanıcı ya da workspace başına limit: bir ekibin ortak hesabı yakmasını önleyin.

Üretimde harcamayı workspace_id, task_id ve model ile anahtarlanmış bir veritabanı tablosunda tutun. Yalnızca tedarikçi panolarına güvenmeyin. Onlar canlı ürün kontrolü için değil, fatura mutabakatı içindir.

Prompt caching’i de agresif kullanın. Anthropic, Fable’ın prompt caching için mevcut %90 giriş-token indirimi tuttuğunu söylüyor; Sonnet ve Opus sayfaları da prompt caching ile %90’a varan tasarruf listeliyor (Fable, Sonnet, Opus). Stabil parçaları cache’leyin: repo haritası, kodlama standartları, API dokümanları, şema özetleri ve uzun ürün spesifikasyonları. Değişken kullanıcı talimatlarını cache’lemeyin.

İyi bir yönlendirme katmanı her çağrı için şu alanları log’lamalıdır:

{
  "task_kind": "migration",
  "chosen_model": "opus",
  "fallback_from": "fable",
  "estimated_cost_usd": 0.18,
  "budget_usd": 0.20,
  "input_tokens": 12000,
  "max_output_tokens": 3000
}

Bu log, CFO’ya, staff engineer’a ve ajanın neden durduğunu soran kullanıcıya vereceğiniz cevaptır.

Adım 4: Fallback’i Ürün Davranışı Olarak Ele Alın

Fable için planlamanız gereken iki tür fallback var.

İlki normal altyapı fallback’i: kullanılamayan model, rate limit, timeout, sağlayıcı sorunu. Bugünkü Fable durumu bunun neden önemli olduğunu kanıtlıyor. Anthropic, diğer modellere erişimin 12 Haziran direktifinden etkilenmediğini söylüyor (Anthropic); dolayısıyla iyi bir uygulama Opus ya da Sonnet üzerinden çalışmaya devam etmelidir.

İkincisi güvenlik fallback’i. Anthropic, Fable’ın işaretlenen bazı siber güvenlik ve biyoloji isteklerini Opus 4.8’e yönlendirdiğini ve yeniden yönlendirilen istekler için kullanıcılardan Fable fiyatı alınmadığını söylüyor (Anthropic Fable). Lansman yazısı, bu korumaların ortalama oturumların %5’inden azında tetiklendiğini, bazı false positive’lerin beklendiğini söylüyor (Anthropic lansmanı).

Bunu kullanıcılardan saklamayın. Güvenlik inceleme ürününüz Fable ister ve Opus davranışı alırsa, UI şöyle bir şey söylemelidir:

“Bu istek, işaretlenen bölüm için daha güvenli fallback rotasını kullandı. Sonuçlar daha az kapsamlı olabilir. Bütçe etkisi ayarlandı.”

Bu, her cevabın aynı modelden gelmiş gibi yapılmasından iyidir. Ayrıca eval’lerinizi de korur. Fable’ı benchmark ediyor ama test setinizin yarısı fallback tetikliyorsa modeli ölçtüğünüz kadar classifier yolunuzu da ölçüyorsunuz.

Opak bir model seçiciyi, seçilen mod bilgisini gösteren şeffaf yönlendirme durumu paneliyle karşılaştıran önce-sonra UI mockup’ı

Bu Hafta Ne Yayına Alınmalı

Fable feature flag’inden önce router’ı yayına alın.

Çoğu geliştirici ürünü için önerdiğim varsayılanlar basit:

Kod açıklaması, küçük düzeltmeler, testler, dokümanlar: Sonnet 4.6.
PR incelemesi, üretim hataları, mimari kararlar: Opus 4.8.
Net iş getirisi olan çok saatlik ya da çok günlük ajan işleri: mevcutsa Fable 5, Opus fallback ile.
Sınırı belirsiz her şey: kullanıcı bütçe belirleyene kadar Fable yok.
Birçok kullanıcıda tekrarlanan her şey: uzun bağlamı cache’leyin ya da batch’leyin.

Mesele en üst modeli kutsamak değil. Mesele frontier token’larını sonucu değiştirdikleri yerde harcamak.

Fable 5 bu hafta HN’de insanların tartıştığı model olabilir. Sonnet hâlâ çoğu üretim trafiğinin başlaması gereken yer. Opus güvenilir orta katman. Kazanan uygulama; sert limitleri, dürüst fallback’i ve hem kaliteyi hem maliyeti debug etmeye yetecek kadar iyi log’ları olan sıkıcı bir router’dır.

Kurulumu test etmenin en hızlı yolunu istiyorsanız OneHop üzerinde Claude Fable 5 sayfasını açın, hesap oluşturun ve 10 dolar ücretsiz krediyle başlayın. Sonra yukarıdaki router’ı tüm ürüne değil, tek bir iş akışına bağlayın. Kabul edilen sonuç başına maliyeti ölçün. O sayı, lansman haftasındaki herhangi bir benchmark’tan daha önemlidir.