Claude Sonnet 5: cos'e', prezzi e come provarlo subito

Anthropic ha rilasciato il 30 giugno 2026 Claude Sonnet 5 (identificativo claude-sonnet-5), definendolo il Sonnet piu' agentico di sempre. La promessa: prestazioni vicine al modello di punta Opus 4.8, ma a una frazione del prezzo. In una fase in cui le aziende tagliano la spesa in token, e' un posizionamento preciso, lo strumento giusto per far girare agenti autonomi senza far esplodere i costi.

Cosa lo rende diverso: agenti che restano sul pezzo

Il salto dichiarato non e' tanto nella conoscenza enciclopedica quanto nel comportamento agentico: la capacita' di fare piani, usare strumenti come browser e terminale e lavorare in autonomia per molti passaggi senza perdere il filo. Secondo l'annuncio ufficiale di Anthropic, Sonnet 5 "resta sul piano, rispetta le convenzioni e produce modifiche pulite su piu' passaggi". Anthropic sottolinea anche un tasso piu' basso di comportamenti indesiderati rispetto a Sonnet 4.6, quindi maggiore sicurezza negli usi agentici.

Il modello dà il meglio, dice l'azienda, sul cosiddetto codice "brownfield", cioe' basi di codice gia' esistenti e disordinate: invece di tamponare il sintomo, tende a risalire alla causa reale di un bug e a proporre una correzione duratura. Porta con se' una finestra di contesto da 1 milione di token, sufficiente a tenere in memoria interi progetti.

Sonnet 5 e' pensato per gli agenti: pianifica, usa terminale e browser e lavora in autonomia su piu' passaggi.

I numeri: come si colloca tra i benchmark

Sui test pubblici Sonnet 5 si piazza appena sotto Opus 4.8 spendendo molto meno. Guida su SWE-bench Pro rispetto ai rivali diretti (63,2 contro il 58,6 di GPT-5.5), pur restando dietro a Opus 4.8 (69,2) sullo stesso test. Sfiora Opus su Humanity's Last Exam con strumenti (57,4% contro 57,9%) e lo supera di misura su alcuni compiti di lavoro della conoscenza. In sintesi: per la maggior parte dei compiti reali, la differenza con il modello di punta e' minima, mentre il divario di prezzo e' enorme. Per il lavoro piu' delicato, come la cybersicurezza, Anthropic continua a consigliare Opus.

Quanto costa: prezzo di lancio e l'insidia del tokenizer

Il prezzo e' il vero argomento. Fino al 31 agosto 2026 il costo introduttivo e' di 2 dollari per milione di token in ingresso e 10 dollari per milione in uscita. Dal 1 settembre passera' a 3/15 dollari, in linea con Sonnet 4.6. Per confronto, Opus 4.8 costa 5 e 25 dollari. C'e' pero' un dettaglio da conoscere, segnalato anche da TechCrunch e nella documentazione sui prezzi: il nuovo tokenizer conta circa 1,0-1,35 volte piu' token per lo stesso testo. Il risultato e' che la spesa reale per compito puo' avvicinarsi a quella di Sonnet 4.6 nonostante il listino identico. Regola pratica: misurate il costo per operazione, non solo il prezzo al milione di token.

Come provarlo gratis e a pagamento

Sonnet 5 e' gia' il modello predefinito per gli utenti Free e Pro su claude.ai ed e' disponibile anche per i piani Max, Team ed Enterprise. In pratica, per provarlo senza spendere nulla:

Vai su claude.ai e accedi con un account gratuito. Nella chat, verifica dal selettore del modello che sia attivo "Sonnet 5". Il piano Free ha limiti di messaggi che si azzerano ogni poche ore: sufficienti per valutarlo, non per un uso intensivo.
Per gli sviluppatori, il modello e' vivo in Claude Code, nell'API di Anthropic e integrato in strumenti come Cursor, VS Code e GitHub Copilot: basta selezionare claude-sonnet-5 come modello.

Chi usa l'API puo' iniziare con una chiamata minima. Esempio con curl (serve una chiave API dal portale di Anthropic):

curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-sonnet-5",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Riassumi in 5 punti i rischi di un CV scritto interamente dall IA."}
    ]
  }'

La risposta arriva in formato JSON, con il testo dentro il campo content. Un prompt utile per testare la vocazione agentica del modello, in Claude Code o in un editor collegato, e':

"Analizza questo repository, individua la causa del test che fallisce in modo intermittente e proponi una correzione spiegando perche' il bug si verifica. Non modificare altri file."

Il risultato atteso e' una diagnosi che risale alla causa (spesso una race condition o uno stato condiviso) e una patch mirata, non un rattoppo generico.

Per chi conviene e quando restare su altro

Sonnet 5 e' la scelta sensata per la maggior parte degli usi quotidiani: assistenza alla programmazione, automazioni agentiche, analisi di documenti lunghi, generazione e revisione di testo. Conviene passare a Opus 4.8 solo per i compiti piu' difficili — sicurezza informatica, ragionamento estremo — dove il margine di qualita' giustifica il costo. Se invece la priorita' e' il costo minimo assoluto e il compito e' semplice, valgono ancora i modelli aperti come DeepSeek o Qwen, da far girare in locale o su API a basso prezzo. La novita' di questo lancio e' che la fascia "quasi top di gamma" e' diventata molto piu' economica: ed e' esattamente cio' che il mercato, in piena caccia all'efficienza, stava chiedendo.