Novità da Anthropic: Sonnet 4.5 e Agent SDK open source per agenti AI

Claude Sonnet 4.5 e Agent SDK open source portano l’AI oltre la chat: più autonomia, sicurezza e strumenti per creare agenti AI personalizzati.

Loading the

Anthropic ha annunciato Claude Sonnet 4.5 e il nuovo Claude Agent SDK open source, due strumenti che segnano un passo importante nel rendere l’intelligenza artificiale più autonoma e utile per sviluppatori e aziende.

Con queste novità, i modelli Claude possono lavorare su file, strumenti e processi complessi in modo continuo e affidabile, aprendo la strada a operatori digitali personalizzati e integrati con i dati aziendali.

Claude Sonnet 4.5: più potenza, più stabilità, più sicurezza

Durante i test interni Sonnet 4.5 ha dimostrato di poter sostenere attività complesse per oltre 30 ore consecutive. Un esempio concreto: la creazione autonoma di un’app tipo Slack/Teams con più di 11.000 righe di codice generate senza intervento umano.
Per confronto, il precedente Opus 4 non superava le sette ore.

Novità principali:

Reasoning e coding avanzati: meno errori e più capacità di iterare su task multi-step.
Checkpoint e memoria: possibilità di salvare progressi e tornare indietro nelle sessioni lunghe.
Creazione file integrata: documenti, fogli di calcolo e presentazioni direttamente in chat.
Nuova interfaccia terminale + estensione VS Code per sviluppatori.
Difese anti prompt injection e AI Safety Level 3 (ASL-3): filtri più precisi e meno falsi positivi.

Queste funzioni rendono Sonnet 4.5 un motore operativo ideale per agenti AI autonomi, non più solo un chatbot.

Benchmark: Sonnet 4.5 al vertice

Nel benchmark SWE-bench Verified (n=500), che misura le capacità reali di coding su repository open source:

  • Claude Sonnet 4.5 → 77.2% (82% con parallel test-time compute)
  • Opus 4.1 → 74.5%
  • Sonnet 4 → 72.7%
  • GPT-5 Codex → 74.5%
  • Gemini 2.5 Pro → 67.2%

Altri risultati notevoli:
OSWorld (Computer use): 61,4% vs 42,2% Sonnet 4
Terminal Bench (Agentic terminal coding): 50% vs 36% Sonnet 4
High School Math Competition: 100% Python e 87% no tools
Finance Agent: 55.3% vs 44.5% Sonnet 4
Multilingual Q&A (MMMLU): 89.1%

Questi dati mostrano un modello più affidabile e versatile, in grado di gestire coding, strumenti, reasoning e automazioni complesse.

Claude Agent SDK: toolkit open source per creare veri agenti AI

Assieme al modello, Anthropic ha rilasciato l’Agent SDK open source: la stessa infrastruttura che alimentava Claude Code, ora disponibile a tutti.

Con l’SDK puoi:
→ Dare accesso a terminale, file system e MCP al tuo agente.
→ Creare subagenti paralleli con contesto isolato.
→ Compattare automaticamente il contesto e usare memoria persistente.
→ Integrare Slack, Google Drive, GitHub e altri servizi.
→ Sfruttare code generation e scripting per automazioni avanzate.

In altre parole, puoi passare da “chatbot” a operatori digitali che gestiscono dati, API e flussi aziendali.

Un esempio pratico: l’Email Agent

Anthropic propone come esempio un Email Agent (demo disponibile su GitHub: Claude Code SDK Demos) che:

  • Archivia conversazioni in cartelle dedicate
  • Usa comandi bash (grep, tail) per cercare nei file
  • Lancia subagenti per analisi parallela
  • Compatta il contesto per non superare i limiti
  • Automatizza regole e script Python per risposte e smistamento

Questo approccio spiega bene la filosofia agentica dell’SDK open source e come puoi trasformare Claude in un vero assistente operativo.

Prompt trapelato: cosa rivela su Sonnet 4.5

⚠️ Nota: su GitHub circola già il “system prompt” di Sonnet 4.5 da parte di x1xhlol.

Ragionamento step-by-step per problemi complessi (math, coding, logica).
Trasparenza sui limiti e uso di web search per aggiornare le informazioni.
Focus su sicurezza e anti prompt injection con filtri integrati.
Stile conversazionale naturale e strutturato.
Supporto nativo a CSV, codice multi-linguaggio, MCP.

Queste direttive spiegano molti dei miglioramenti visti in Sonnet 4.5 e nell’Agent SDK open source.

Imagine with Claude: la preview che mostra la creazione in tempo reale

Per pochi giorni Anthropic offre agli utenti Max “Imagine with Claude”, una preview che mostra il modello generare software in tempo reale senza codice predefinito.
È un assaggio delle capacità autonome che potresti implementare con l’Agent SDK.

Alcuni vantaggi

  • Autonomia: da 7 ore (Opus 4) a 30 ore (Sonnet 4.5).
  • Sicurezza: AI Safety Level 3 e meno falsi positivi.
  • Open source: toolkit ufficiale a disposizione della community.
  • Prestazioni: in testa ai benchmark su coding, uso strumenti e reasoning.
  • Applicazioni reali: aziende come Canva, GitHub e Cursor già in test.

Come iniziare subito

  1. Vai alla pagina della documentazione ufficiale Anthropic e scarica l’SDK open source.
  2. Esamina l’esempio dell’Email Agent o altri template ufficiali.
  3. Definisci un compito reale (es. ordinare email aziendali o aggregare dati).
  4. Configura subagenti e strumenti MCP per i tuoi servizi (Slack, GitHub, Google Drive).
  5. Testa il ciclo agente “context → action → verify” con piccoli task, poi scala.
  6. Aggiungi regole di sicurezza e logging per controllare l’operato dell’agente.

Conclusione

Con Claude Sonnet 4.5 e Agent SDK open source, Anthropic non ha solo aggiornato un modello ma ha creato un ecosistema per sviluppare agenti AI realmente operativi.
I benchmark mostrano performance di alto livello su coding, reasoning, multilingua e automazioni.
E grazie alle istruzioni trapelate dal presunto system prompt possiamo intuire come il modello sia stato progettato per essere più sicuro, trasparente e ragionato.

Questa combinazione riduce drasticamente il tempo necessario per costruire soluzioni AI complesse, rendendole accessibili a sviluppatori, aziende e start-up.

🔗 Leggi l’annuncio ufficiale su Anthropic

Per altre novità, esempi pratici e guide passo-passo sugli agenti AI seguimi anche sul mio canale YouTube

Francesco Gruner
Francesco Gruner

Sono un consulente IT, divulgatore e imprenditore tech. Mi occupo di automazione, AI e gestione di sistemi e infrastrutture IT, cercando soluzioni semplici a problemi complessi. Qui condivido strumenti, esperimenti e idee utili.

Resta aggiornato su AI e Automazione

Un recap con novità sull’AI, casi reali e strumenti che uso ogni giorno.

Lascia una risposta

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *