# Novità da Anthropic: Sonnet 4.5 e Agent SDK open source per agenti AI

> Fonte: https://francescogruner.it/novita-da-anthropic-sonnet-4-5-e-agent-sdk-open-source-per-agenti-ai/

Anthropic ha annunciato **Claude Sonnet 4.5** e il nuovo **Claude Agent SDK open source**, due strumenti che segnano un passo importante nel rendere l’intelligenza artificiale più autonoma e utile per sviluppatori e aziende.

 

Con queste novità, i modelli Claude possono **lavorare su file, strumenti e processi complessi** in modo continuo e affidabile, aprendo la strada a **operatori digitali personalizzati** e integrati con i dati aziendali.

      

Indice dei contenuti

 [Toggle](#) 

- [Claude Sonnet 4.5: più potenza, più stabilità, più sicurezza](#Claude_Sonnet_45_piu_potenza_piu_stabilita_piu_sicurezza)

- [Novità principali:](#Novita_principali)
- [Ti sta piacendo?](#Ti_sta_piacendo)
- [Benchmark: Sonnet 4.5 al vertice](#Benchmark_Sonnet_45_al_vertice)
- [Claude Agent SDK: toolkit open source per creare veri agenti AI](#Claude_Agent_SDK_toolkit_open_source_per_creare_veri_agenti_AI)
- [Un esempio pratico: l’Email Agent](#Un_esempio_pratico_lEmail_Agent)
- [Prompt trapelato: cosa rivela su Sonnet 4.5](#Prompt_trapelato_cosa_rivela_su_Sonnet_45)
- [Imagine with Claude: la preview che mostra la creazione in tempo reale](#Imagine_with_Claude_la_preview_che_mostra_la_creazione_in_tempo_reale)
- [Alcuni vantaggi](#Alcuni_vantaggi)
- [Come iniziare subito](#Come_iniziare_subito)
- [Conclusione](#Conclusione)

 

## Claude Sonnet 4.5: più potenza, più stabilità, più sicurezza

 

Durante i test interni Sonnet 4.5 ha dimostrato di poter sostenere attività complesse per oltre **30 ore consecutive**. Un esempio concreto: la creazione autonoma di un’app tipo Slack/Teams con più di 11.000 righe di codice generate senza intervento umano.  
Per confronto, il precedente Opus 4 non superava le sette ore.

 

### Novità principali:

 

→ **Reasoning e coding avanzati**: meno errori e più capacità di iterare su task multi-step.  
→ **Checkpoint e memoria**: possibilità di salvare progressi e tornare indietro nelle sessioni lunghe.  
→ **Creazione file integrata**: documenti, fogli di calcolo e presentazioni direttamente in chat.  
→ **Nuova interfaccia terminale + estensione VS Code** per sviluppatori.  
→ **Difese anti prompt injection e AI Safety Level 3 (ASL-3)**: filtri più precisi e meno falsi positivi.

 

Queste funzioni rendono Sonnet 4.5 un **motore operativo** ideale per agenti AI autonomi, non più solo un chatbot.

                  

## Ti sta piacendo?

 

Ricevi una guida pratica ogni settimana. AI, tool e automazioni.

            Iscriviti gratis             Perfetto, sei dentro.         

## Benchmark: Sonnet 4.5 al vertice

 

![](https://francescogruner.it/wp-content/uploads/2025/09/benchmark-SWE-bench-Verified-1024x901.webp)

 

Nel benchmark **SWE-bench Verified** (n=500), che misura le capacità reali di coding su repository open source:

 

- **Claude Sonnet 4.5** → 77.2% (82% con parallel test-time compute)
- Opus 4.1 → 74.5%
- Sonnet 4 → 72.7%
- GPT-5 Codex → 74.5%
- Gemini 2.5 Pro → 67.2%

 

Altri risultati notevoli:  
→ **OSWorld (Computer use)**: 61,4% vs 42,2% Sonnet 4  
→ **Terminal Bench (Agentic terminal coding)**: 50% vs 36% Sonnet 4  
→ **High School Math Competition**: 100% Python e 87% no tools  
→ **Finance Agent**: 55.3% vs 44.5% Sonnet 4  
→ **Multilingual Q&A (MMMLU)**: 89.1%

 

Questi dati mostrano un modello **più affidabile e versatile**, in grado di gestire coding, strumenti, reasoning e automazioni complesse.

 

## Claude Agent SDK: toolkit open source per creare veri agenti AI

 

Assieme al modello, Anthropic ha rilasciato l’**Agent SDK open source**: la stessa infrastruttura che alimentava Claude Code, ora disponibile a tutti.

 

Con l’SDK puoi:  
→ Dare accesso a terminale, file system e MCP al tuo agente.  
→ Creare subagenti paralleli con contesto isolato.  
→ Compattare automaticamente il contesto e usare memoria persistente.  
→ Integrare Slack, Google Drive, GitHub e altri servizi.  
→ Sfruttare code generation e scripting per automazioni avanzate.

 

In altre parole, puoi passare da “chatbot” a **operatori digitali** che gestiscono dati, API e flussi aziendali.

 

## Un esempio pratico: l’Email Agent

 

Anthropic propone come esempio un **[Email Agent](https://github.com/anthropics/claude-code-sdk-demos?utm_source=chatgpt.com)** (demo disponibile su GitHub: [Claude Code SDK Demos](https://github.com/anthropics/claude-code-sdk-demos?utm_source=chatgpt.com)) che:

 

- Archivia conversazioni in cartelle dedicate
- Usa comandi bash (`grep`, `tail`) per cercare nei file
- Lancia subagenti per analisi parallela
- Compatta il contesto per non superare i limiti
- Automatizza regole e script Python per risposte e smistamento

 

Questo approccio spiega bene la **filosofia agentica** dell’SDK open source e come puoi trasformare Claude in un vero **assistente operativo**.

 

## Prompt trapelato: cosa rivela su Sonnet 4.5

 

⚠️ **Nota**: su [GitHub](https://github.com/x1xhlol/system-prompts-and-models-of-ai-tools/tree/main/Anthropic?utm_source=chatgpt.com) circola già il “system prompt” di Sonnet 4.5 da parte di x1xhlol.

 

→ **Ragionamento step-by-step** per problemi complessi (math, coding, logica).  
→ **Trasparenza sui limiti** e uso di web search per aggiornare le informazioni.  
→ **Focus su sicurezza e anti prompt injection** con filtri integrati.  
→ **Stile conversazionale naturale** e strutturato.  
→ **Supporto nativo a CSV, codice multi-linguaggio, MCP**.

 

Queste direttive spiegano molti dei miglioramenti visti in Sonnet 4.5 e nell’Agent SDK open source.

 

## Imagine with Claude: la preview che mostra la creazione in tempo reale

 

Per pochi giorni Anthropic offre agli utenti Max **“Imagine with Claude”**, una preview che mostra il modello generare software in tempo reale senza codice predefinito.  
È un assaggio delle capacità autonome che potresti implementare con l’Agent SDK.

    

## Alcuni vantaggi

 

- **Autonomia**: da 7 ore (Opus 4) a 30 ore (Sonnet 4.5).
- **Sicurezza**: AI Safety Level 3 e meno falsi positivi.
- **Open source**: toolkit ufficiale a disposizione della community.
- **Prestazioni**: in testa ai benchmark su coding, uso strumenti e reasoning.
- **Applicazioni reali**: aziende come Canva, GitHub e Cursor già in test.

 

## Come iniziare subito

 

1. Vai alla [pagina della documentazione ufficiale Anthropic](https://docs.claude.com/en/api/agent-sdk/overview) e scarica l’SDK open source.
2. Esamina l’esempio dell’[Email Agent](https://github.com/anthropics/claude-code-sdk-demos?utm_source=chatgpt.com) o altri template ufficiali.
3. Definisci un compito reale (es. ordinare email aziendali o aggregare dati).
4. Configura subagenti e strumenti MCP per i tuoi servizi (Slack, GitHub, Google Drive).
5. Testa il ciclo agente “context → action → verify” con piccoli task, poi scala.
6. Aggiungi regole di sicurezza e logging per controllare l’operato dell’agente.

 

## Conclusione

 

Con **Claude Sonnet 4.5** e **Agent SDK open source**, Anthropic non ha solo aggiornato un modello ma ha creato un ecosistema per sviluppare **agenti AI realmente operativi**.  
I benchmark mostrano performance di alto livello su coding, reasoning, multilingua e automazioni.  
E grazie alle istruzioni trapelate dal presunto system prompt possiamo intuire come il modello sia stato progettato per essere più sicuro, trasparente e ragionato.

 

Questa combinazione riduce drasticamente il tempo necessario per costruire soluzioni AI complesse, rendendole accessibili a sviluppatori, aziende e start-up.

 

🔗 [Leggi l’annuncio ufficiale su Anthropic](https://www.anthropic.com/news/claude-sonnet-4-5?utm_source=chatgpt.com)

 

Per altre novità, esempi pratici e guide passo-passo sugli agenti AI seguimi anche sul mio [canale YouTube](https://www.youtube.com/@FrancescoGruner)