# Novità da Anthropic: Sonnet 4.5 e Agent SDK open source per agenti AI > Fonte: https://francescogruner.it/novita-da-anthropic-sonnet-4-5-e-agent-sdk-open-source-per-agenti-ai/ Anthropic ha annunciato **Claude Sonnet 4.5** e il nuovo **Claude Agent SDK open source**, due strumenti che segnano un passo importante nel rendere l’intelligenza artificiale più autonoma e utile per sviluppatori e aziende. Con queste novità, i modelli Claude possono **lavorare su file, strumenti e processi complessi** in modo continuo e affidabile, aprendo la strada a **operatori digitali personalizzati** e integrati con i dati aziendali. Indice dei contenuti [Toggle](#) - [Claude Sonnet 4.5: più potenza, più stabilità, più sicurezza](#Claude_Sonnet_45_piu_potenza_piu_stabilita_piu_sicurezza) - [Novità principali:](#Novita_principali) - [Ti sta piacendo?](#Ti_sta_piacendo) - [Benchmark: Sonnet 4.5 al vertice](#Benchmark_Sonnet_45_al_vertice) - [Claude Agent SDK: toolkit open source per creare veri agenti AI](#Claude_Agent_SDK_toolkit_open_source_per_creare_veri_agenti_AI) - [Un esempio pratico: l’Email Agent](#Un_esempio_pratico_lEmail_Agent) - [Prompt trapelato: cosa rivela su Sonnet 4.5](#Prompt_trapelato_cosa_rivela_su_Sonnet_45) - [Imagine with Claude: la preview che mostra la creazione in tempo reale](#Imagine_with_Claude_la_preview_che_mostra_la_creazione_in_tempo_reale) - [Alcuni vantaggi](#Alcuni_vantaggi) - [Come iniziare subito](#Come_iniziare_subito) - [Conclusione](#Conclusione) ## Claude Sonnet 4.5: più potenza, più stabilità, più sicurezza Durante i test interni Sonnet 4.5 ha dimostrato di poter sostenere attività complesse per oltre **30 ore consecutive**. Un esempio concreto: la creazione autonoma di un’app tipo Slack/Teams con più di 11.000 righe di codice generate senza intervento umano. Per confronto, il precedente Opus 4 non superava le sette ore. ### Novità principali: → **Reasoning e coding avanzati**: meno errori e più capacità di iterare su task multi-step. → **Checkpoint e memoria**: possibilità di salvare progressi e tornare indietro nelle sessioni lunghe. → **Creazione file integrata**: documenti, fogli di calcolo e presentazioni direttamente in chat. → **Nuova interfaccia terminale + estensione VS Code** per sviluppatori. → **Difese anti prompt injection e AI Safety Level 3 (ASL-3)**: filtri più precisi e meno falsi positivi. Queste funzioni rendono Sonnet 4.5 un **motore operativo** ideale per agenti AI autonomi, non più solo un chatbot. ## Ti sta piacendo? Ricevi una guida pratica ogni settimana. AI, tool e automazioni. Iscriviti gratis Perfetto, sei dentro. ## Benchmark: Sonnet 4.5 al vertice ![](https://francescogruner.it/wp-content/uploads/2025/09/benchmark-SWE-bench-Verified-1024x901.webp) Nel benchmark **SWE-bench Verified** (n=500), che misura le capacità reali di coding su repository open source: - **Claude Sonnet 4.5** → 77.2% (82% con parallel test-time compute) - Opus 4.1 → 74.5% - Sonnet 4 → 72.7% - GPT-5 Codex → 74.5% - Gemini 2.5 Pro → 67.2% Altri risultati notevoli: → **OSWorld (Computer use)**: 61,4% vs 42,2% Sonnet 4 → **Terminal Bench (Agentic terminal coding)**: 50% vs 36% Sonnet 4 → **High School Math Competition**: 100% Python e 87% no tools → **Finance Agent**: 55.3% vs 44.5% Sonnet 4 → **Multilingual Q&A (MMMLU)**: 89.1% Questi dati mostrano un modello **più affidabile e versatile**, in grado di gestire coding, strumenti, reasoning e automazioni complesse. ## Claude Agent SDK: toolkit open source per creare veri agenti AI Assieme al modello, Anthropic ha rilasciato l’**Agent SDK open source**: la stessa infrastruttura che alimentava Claude Code, ora disponibile a tutti. Con l’SDK puoi: → Dare accesso a terminale, file system e MCP al tuo agente. → Creare subagenti paralleli con contesto isolato. → Compattare automaticamente il contesto e usare memoria persistente. → Integrare Slack, Google Drive, GitHub e altri servizi. → Sfruttare code generation e scripting per automazioni avanzate. In altre parole, puoi passare da “chatbot” a **operatori digitali** che gestiscono dati, API e flussi aziendali. ## Un esempio pratico: l’Email Agent Anthropic propone come esempio un **[Email Agent](https://github.com/anthropics/claude-code-sdk-demos?utm_source=chatgpt.com)** (demo disponibile su GitHub: [Claude Code SDK Demos](https://github.com/anthropics/claude-code-sdk-demos?utm_source=chatgpt.com)) che: - Archivia conversazioni in cartelle dedicate - Usa comandi bash (`grep`, `tail`) per cercare nei file - Lancia subagenti per analisi parallela - Compatta il contesto per non superare i limiti - Automatizza regole e script Python per risposte e smistamento Questo approccio spiega bene la **filosofia agentica** dell’SDK open source e come puoi trasformare Claude in un vero **assistente operativo**. ## Prompt trapelato: cosa rivela su Sonnet 4.5 ⚠️ **Nota**: su [GitHub](https://github.com/x1xhlol/system-prompts-and-models-of-ai-tools/tree/main/Anthropic?utm_source=chatgpt.com) circola già il “system prompt” di Sonnet 4.5 da parte di x1xhlol. → **Ragionamento step-by-step** per problemi complessi (math, coding, logica). → **Trasparenza sui limiti** e uso di web search per aggiornare le informazioni. → **Focus su sicurezza e anti prompt injection** con filtri integrati. → **Stile conversazionale naturale** e strutturato. → **Supporto nativo a CSV, codice multi-linguaggio, MCP**. Queste direttive spiegano molti dei miglioramenti visti in Sonnet 4.5 e nell’Agent SDK open source. ## Imagine with Claude: la preview che mostra la creazione in tempo reale Per pochi giorni Anthropic offre agli utenti Max **“Imagine with Claude”**, una preview che mostra il modello generare software in tempo reale senza codice predefinito. È un assaggio delle capacità autonome che potresti implementare con l’Agent SDK. ## Alcuni vantaggi - **Autonomia**: da 7 ore (Opus 4) a 30 ore (Sonnet 4.5). - **Sicurezza**: AI Safety Level 3 e meno falsi positivi. - **Open source**: toolkit ufficiale a disposizione della community. - **Prestazioni**: in testa ai benchmark su coding, uso strumenti e reasoning. - **Applicazioni reali**: aziende come Canva, GitHub e Cursor già in test. ## Come iniziare subito 1. Vai alla [pagina della documentazione ufficiale Anthropic](https://docs.claude.com/en/api/agent-sdk/overview) e scarica l’SDK open source. 2. Esamina l’esempio dell’[Email Agent](https://github.com/anthropics/claude-code-sdk-demos?utm_source=chatgpt.com) o altri template ufficiali. 3. Definisci un compito reale (es. ordinare email aziendali o aggregare dati). 4. Configura subagenti e strumenti MCP per i tuoi servizi (Slack, GitHub, Google Drive). 5. Testa il ciclo agente “context → action → verify” con piccoli task, poi scala. 6. Aggiungi regole di sicurezza e logging per controllare l’operato dell’agente. ## Conclusione Con **Claude Sonnet 4.5** e **Agent SDK open source**, Anthropic non ha solo aggiornato un modello ma ha creato un ecosistema per sviluppare **agenti AI realmente operativi**. I benchmark mostrano performance di alto livello su coding, reasoning, multilingua e automazioni. E grazie alle istruzioni trapelate dal presunto system prompt possiamo intuire come il modello sia stato progettato per essere più sicuro, trasparente e ragionato. Questa combinazione riduce drasticamente il tempo necessario per costruire soluzioni AI complesse, rendendole accessibili a sviluppatori, aziende e start-up. 🔗 [Leggi l’annuncio ufficiale su Anthropic](https://www.anthropic.com/news/claude-sonnet-4-5?utm_source=chatgpt.com) Per altre novità, esempi pratici e guide passo-passo sugli agenti AI seguimi anche sul mio [canale YouTube](https://www.youtube.com/@FrancescoGruner)