Novità da Anthropic: Sonnet 4.5 e Agent SDK open source per agenti AI

Anthropic ha annunciato Claude Sonnet 4.5 e il nuovo Claude Agent SDK open source, due strumenti che segnano un passo importante nel rendere l’intelligenza artificiale più autonoma e utile per sviluppatori e aziende.

Con queste novità, i modelli Claude possono lavorare su file, strumenti e processi complessi in modo continuo e affidabile, aprendo la strada a operatori digitali personalizzati e integrati con i dati aziendali.

Indice dei contenuti

Claude Sonnet 4.5: più potenza, più stabilità, più sicurezza

Durante i test interni Sonnet 4.5 ha dimostrato di poter sostenere attività complesse per oltre 30 ore consecutive. Un esempio concreto: la creazione autonoma di un’app tipo Slack/Teams con più di 11.000 righe di codice generate senza intervento umano.
Per confronto, il precedente Opus 4 non superava le sette ore.

Novità principali:

→ Reasoning e coding avanzati: meno errori e più capacità di iterare su task multi-step.
→ Checkpoint e memoria: possibilità di salvare progressi e tornare indietro nelle sessioni lunghe.
→ Creazione file integrata: documenti, fogli di calcolo e presentazioni direttamente in chat.
→ Nuova interfaccia terminale + estensione VS Code per sviluppatori.
→ Difese anti prompt injection e AI Safety Level 3 (ASL-3): filtri più precisi e meno falsi positivi.

Queste funzioni rendono Sonnet 4.5 un motore operativo ideale per agenti AI autonomi, non più solo un chatbot.

Benchmark: Sonnet 4.5 al vertice

Nel benchmark SWE-bench Verified (n=500), che misura le capacità reali di coding su repository open source:

Claude Sonnet 4.5 → 77.2% (82% con parallel test-time compute)
Opus 4.1 → 74.5%
Sonnet 4 → 72.7%
GPT-5 Codex → 74.5%
Gemini 2.5 Pro → 67.2%

Altri risultati notevoli:
→ OSWorld (Computer use): 61,4% vs 42,2% Sonnet 4
→ Terminal Bench (Agentic terminal coding): 50% vs 36% Sonnet 4
→ High School Math Competition: 100% Python e 87% no tools
→ Finance Agent: 55.3% vs 44.5% Sonnet 4
→ Multilingual Q&A (MMMLU): 89.1%

Questi dati mostrano un modello più affidabile e versatile, in grado di gestire coding, strumenti, reasoning e automazioni complesse.

Claude Agent SDK: toolkit open source per creare veri agenti AI

Assieme al modello, Anthropic ha rilasciato l’Agent SDK open source: la stessa infrastruttura che alimentava Claude Code, ora disponibile a tutti.

Con l’SDK puoi:
→ Dare accesso a terminale, file system e MCP al tuo agente.
→ Creare subagenti paralleli con contesto isolato.
→ Compattare automaticamente il contesto e usare memoria persistente.
→ Integrare Slack, Google Drive, GitHub e altri servizi.
→ Sfruttare code generation e scripting per automazioni avanzate.

In altre parole, puoi passare da “chatbot” a operatori digitali che gestiscono dati, API e flussi aziendali.

Un esempio pratico: l’Email Agent

Anthropic propone come esempio un Email Agent (demo disponibile su GitHub: Claude Code SDK Demos) che:

Archivia conversazioni in cartelle dedicate
Usa comandi bash (grep, tail) per cercare nei file
Lancia subagenti per analisi parallela
Compatta il contesto per non superare i limiti
Automatizza regole e script Python per risposte e smistamento

Questo approccio spiega bene la filosofia agentica dell’SDK open source e come puoi trasformare Claude in un vero assistente operativo.

Prompt trapelato: cosa rivela su Sonnet 4.5

⚠️ Nota: su GitHub circola già il “system prompt” di Sonnet 4.5 da parte di x1xhlol.

→ Ragionamento step-by-step per problemi complessi (math, coding, logica).
→ Trasparenza sui limiti e uso di web search per aggiornare le informazioni.
→ Focus su sicurezza e anti prompt injection con filtri integrati.
→ Stile conversazionale naturale e strutturato.
→ Supporto nativo a CSV, codice multi-linguaggio, MCP.

Queste direttive spiegano molti dei miglioramenti visti in Sonnet 4.5 e nell’Agent SDK open source.

Imagine with Claude: la preview che mostra la creazione in tempo reale

Per pochi giorni Anthropic offre agli utenti Max “Imagine with Claude”, una preview che mostra il modello generare software in tempo reale senza codice predefinito.
È un assaggio delle capacità autonome che potresti implementare con l’Agent SDK.

Alcuni vantaggi

Autonomia: da 7 ore (Opus 4) a 30 ore (Sonnet 4.5).
Sicurezza: AI Safety Level 3 e meno falsi positivi.
Open source: toolkit ufficiale a disposizione della community.
Prestazioni: in testa ai benchmark su coding, uso strumenti e reasoning.
Applicazioni reali: aziende come Canva, GitHub e Cursor già in test.

Come iniziare subito

Vai alla pagina della documentazione ufficiale Anthropic e scarica l’SDK open source.
Esamina l’esempio dell’Email Agent o altri template ufficiali.
Definisci un compito reale (es. ordinare email aziendali o aggregare dati).
Configura subagenti e strumenti MCP per i tuoi servizi (Slack, GitHub, Google Drive).
Testa il ciclo agente “context → action → verify” con piccoli task, poi scala.
Aggiungi regole di sicurezza e logging per controllare l’operato dell’agente.

Conclusione

Con Claude Sonnet 4.5 e Agent SDK open source, Anthropic non ha solo aggiornato un modello ma ha creato un ecosistema per sviluppare agenti AI realmente operativi.
I benchmark mostrano performance di alto livello su coding, reasoning, multilingua e automazioni.
E grazie alle istruzioni trapelate dal presunto system prompt possiamo intuire come il modello sia stato progettato per essere più sicuro, trasparente e ragionato.

Questa combinazione riduce drasticamente il tempo necessario per costruire soluzioni AI complesse, rendendole accessibili a sviluppatori, aziende e start-up.

🔗 Leggi l’annuncio ufficiale su Anthropic

Per altre novità, esempi pratici e guide passo-passo sugli agenti AI seguimi anche sul mio canale YouTube

Scopri i miei video

Glossario

Tools Directory

Risorse

Servizi e Consulenza

Novità da Anthropic: Sonnet 4.5 e Agent SDK open source per agenti AI

Claude Sonnet 4.5: più potenza, più stabilità, più sicurezza

Novità principali:

Benchmark: Sonnet 4.5 al vertice

Claude Agent SDK: toolkit open source per creare veri agenti AI

Un esempio pratico: l’Email Agent

Prompt trapelato: cosa rivela su Sonnet 4.5

Imagine with Claude: la preview che mostra la creazione in tempo reale

Alcuni vantaggi

Come iniziare subito

Conclusione

Francesco Gruner

Lascia una rispostaCancella risposta

Newsletter AI & Automazione

Scopri i miei video

Glossario

Tools Directory

Risorse

Servizi e Consulenza

Claude Sonnet 4.5: più potenza, più stabilità, più sicurezza

Novità principali:

Benchmark: Sonnet 4.5 al vertice

Claude Agent SDK: toolkit open source per creare veri agenti AI

Un esempio pratico: l’Email Agent

Prompt trapelato: cosa rivela su Sonnet 4.5

Imagine with Claude: la preview che mostra la creazione in tempo reale

Alcuni vantaggi

Come iniziare subito

Conclusione

Francesco Gruner

Resta aggiornato su AI e Automazione

Lascia una rispostaCancella risposta

Articoli correlati

Datapizza AI: il framework italiano per agenti e RAG

GLM 4.6 di Z.ai sfida Sonnet 4.5: 200K token, pesi open e costa 10× meno

Qwen3-Omni: analisi del modello che parla italiano e sfida GPT-4o

Ollama Cloud: la guida completa per usare modelli AI senza GPU

Come viene usato ChatGPT? I dati NBER che svelano la realtà

Chatterbox TTS in locale (CPU/GPU) con Docker + Nginx – Guida completa

Di tendenza

Newsletter AI & Automazione