Anthropic ha annunciato Claude Sonnet 4.5 e il nuovo Claude Agent SDK open source, due strumenti che segnano un passo importante nel rendere l’intelligenza artificiale più autonoma e utile per sviluppatori e aziende.
Con queste novità, i modelli Claude possono lavorare su file, strumenti e processi complessi in modo continuo e affidabile, aprendo la strada a operatori digitali personalizzati e integrati con i dati aziendali.
Claude Sonnet 4.5: più potenza, più stabilità, più sicurezza
Durante i test interni Sonnet 4.5 ha dimostrato di poter sostenere attività complesse per oltre 30 ore consecutive. Un esempio concreto: la creazione autonoma di un’app tipo Slack/Teams con più di 11.000 righe di codice generate senza intervento umano.
Per confronto, il precedente Opus 4 non superava le sette ore.
Novità principali:
→ Reasoning e coding avanzati: meno errori e più capacità di iterare su task multi-step.
→ Checkpoint e memoria: possibilità di salvare progressi e tornare indietro nelle sessioni lunghe.
→ Creazione file integrata: documenti, fogli di calcolo e presentazioni direttamente in chat.
→ Nuova interfaccia terminale + estensione VS Code per sviluppatori.
→ Difese anti prompt injection e AI Safety Level 3 (ASL-3): filtri più precisi e meno falsi positivi.
Queste funzioni rendono Sonnet 4.5 un motore operativo ideale per agenti AI autonomi, non più solo un chatbot.
Benchmark: Sonnet 4.5 al vertice

Nel benchmark SWE-bench Verified (n=500), che misura le capacità reali di coding su repository open source:
- Claude Sonnet 4.5 → 77.2% (82% con parallel test-time compute)
- Opus 4.1 → 74.5%
- Sonnet 4 → 72.7%
- GPT-5 Codex → 74.5%
- Gemini 2.5 Pro → 67.2%
Altri risultati notevoli:
→ OSWorld (Computer use): 61,4% vs 42,2% Sonnet 4
→ Terminal Bench (Agentic terminal coding): 50% vs 36% Sonnet 4
→ High School Math Competition: 100% Python e 87% no tools
→ Finance Agent: 55.3% vs 44.5% Sonnet 4
→ Multilingual Q&A (MMMLU): 89.1%
Questi dati mostrano un modello più affidabile e versatile, in grado di gestire coding, strumenti, reasoning e automazioni complesse.
Claude Agent SDK: toolkit open source per creare veri agenti AI
Assieme al modello, Anthropic ha rilasciato l’Agent SDK open source: la stessa infrastruttura che alimentava Claude Code, ora disponibile a tutti.
Con l’SDK puoi:
→ Dare accesso a terminale, file system e MCP al tuo agente.
→ Creare subagenti paralleli con contesto isolato.
→ Compattare automaticamente il contesto e usare memoria persistente.
→ Integrare Slack, Google Drive, GitHub e altri servizi.
→ Sfruttare code generation e scripting per automazioni avanzate.
In altre parole, puoi passare da “chatbot” a operatori digitali che gestiscono dati, API e flussi aziendali.
Un esempio pratico: l’Email Agent
Anthropic propone come esempio un Email Agent (demo disponibile su GitHub: Claude Code SDK Demos) che:
- Archivia conversazioni in cartelle dedicate
- Usa comandi bash (
grep
,tail
) per cercare nei file - Lancia subagenti per analisi parallela
- Compatta il contesto per non superare i limiti
- Automatizza regole e script Python per risposte e smistamento
Questo approccio spiega bene la filosofia agentica dell’SDK open source e come puoi trasformare Claude in un vero assistente operativo.
Prompt trapelato: cosa rivela su Sonnet 4.5
⚠️ Nota: su GitHub circola già il “system prompt” di Sonnet 4.5 da parte di x1xhlol.
→ Ragionamento step-by-step per problemi complessi (math, coding, logica).
→ Trasparenza sui limiti e uso di web search per aggiornare le informazioni.
→ Focus su sicurezza e anti prompt injection con filtri integrati.
→ Stile conversazionale naturale e strutturato.
→ Supporto nativo a CSV, codice multi-linguaggio, MCP.
Queste direttive spiegano molti dei miglioramenti visti in Sonnet 4.5 e nell’Agent SDK open source.
Imagine with Claude: la preview che mostra la creazione in tempo reale
Per pochi giorni Anthropic offre agli utenti Max “Imagine with Claude”, una preview che mostra il modello generare software in tempo reale senza codice predefinito.
È un assaggio delle capacità autonome che potresti implementare con l’Agent SDK.
Alcuni vantaggi
- Autonomia: da 7 ore (Opus 4) a 30 ore (Sonnet 4.5).
- Sicurezza: AI Safety Level 3 e meno falsi positivi.
- Open source: toolkit ufficiale a disposizione della community.
- Prestazioni: in testa ai benchmark su coding, uso strumenti e reasoning.
- Applicazioni reali: aziende come Canva, GitHub e Cursor già in test.
Come iniziare subito
- Vai alla pagina della documentazione ufficiale Anthropic e scarica l’SDK open source.
- Esamina l’esempio dell’Email Agent o altri template ufficiali.
- Definisci un compito reale (es. ordinare email aziendali o aggregare dati).
- Configura subagenti e strumenti MCP per i tuoi servizi (Slack, GitHub, Google Drive).
- Testa il ciclo agente “context → action → verify” con piccoli task, poi scala.
- Aggiungi regole di sicurezza e logging per controllare l’operato dell’agente.
Conclusione
Con Claude Sonnet 4.5 e Agent SDK open source, Anthropic non ha solo aggiornato un modello ma ha creato un ecosistema per sviluppare agenti AI realmente operativi.
I benchmark mostrano performance di alto livello su coding, reasoning, multilingua e automazioni.
E grazie alle istruzioni trapelate dal presunto system prompt possiamo intuire come il modello sia stato progettato per essere più sicuro, trasparente e ragionato.
Questa combinazione riduce drasticamente il tempo necessario per costruire soluzioni AI complesse, rendendole accessibili a sviluppatori, aziende e start-up.
🔗 Leggi l’annuncio ufficiale su Anthropic
Per altre novità, esempi pratici e guide passo-passo sugli agenti AI seguimi anche sul mio canale YouTube