
Questa volta OpenAI l’ha fatto di nuovo… ma non per tutti.
Il 17 luglio 2025 (tra l’altro, il giorno del mio compleanno), è stato annunciato ufficialmente il nuovo ChatGPT Agent, link alla presentazione e, come spesso accade, il rollout parte dagli Stati Uniti. Per l’Europa e la Svizzera, al momento, nessuna data concreta: “più avanti”, dicono.
Nel frattempo, però, il mondo dell’AI agentica si muove velocissimo.
Negli ultimi mesi abbiamo assistito a una corsa frenetica nel mondo degli agenti AI:
→ Manus AI ha attirato l’attenzione della community open-source con un approccio modulare e flessibile,
→ Google sta verticalizzando i suoi agenti dentro Workspace e Android,
→ Perplexity ha lanciato Comet, il primo browser AI-native,
→ mentre da OpenAI ci si aspettava un rilascio open-source… mai arrivato.
E proprio mentre in molti si chiedevano se OpenAI fosse rimasta indietro, è arrivata la risposta:
una funzione che cambia le regole del gioco.
ChatGPT Agent non è un nuovo modello.
È una nuova modalità d’uso dell’intelligenza artificiale: un sistema che unisce azione, ragionamento e interfaccia conversazionale, trasformando una chat in un flusso operativo completo, capace di esplorare il web, prendere decisioni e completare attività per te.
Cos’è ChatGPT Agent?
ChatGPT Agent è un agente AI integrato in ChatGPT che può:
- Navigare in modo autonomo sul web (clic, form, login takeover)
- Eseguire codice in un terminale virtuale
- Accedere a connettori (Gmail, GitHub, Calendar)
- Creare e modificare documenti, fogli di calcolo, presentazioni
- Interrompere e riprendere task mantenendo contesto e stato
Tutto questo avviene tramite un computer virtuale isolato, su cui il modello ha pieno controllo operativo, ma sotto supervisione dell’utente.
Unificazione di Operator, Deep Research e GPT
ChatGPT Agent è il risultato della fusione di tre componenti:
- Operator: per l’interazione autonoma con l’interfaccia web
- Deep Research: per l’analisi multi-step su fonti online
- ChatGPT: per la fluidità e l’adattabilità conversazionale
In precedenza, queste capacità erano separate o utilizzabili solo in contesti specifici. Ora sono convergenti in un singolo flusso agentico, dove la conversazione si fonde con l’esecuzione.
Capacità operative reali
Alcuni esempi concreti di cosa può fare:
- “Controlla il mio calendario e preparami un brief sui prossimi appuntamenti con clienti in base alle ultime notizie”
- “Analizza tre concorrenti e prepara una presentazione con grafici e punti chiave”
- “Compila questo form online per me e conferma la prenotazione”
- “Scrivi codice per generare un report da un file CSV e invialo via mail”
L’agente può utilizzare diverse modalità:
- Browser visuale (UI web per interazione umana)
- Browser testuale (più veloce per informazioni strutturate)
- Terminale (comandi diretti, manipolazione file)
- API e connettori (accesso a servizi esterni)
Sicurezza e controllo utente
Vista la natura autonoma dell’agente, OpenAI ha rafforzato il proprio stack di sicurezza:
- Richiesta di conferma esplicita prima di ogni azione rilevante
- Protezione avanzata da prompt injection su contenuti web (es. HTML invisibile, tag maliziosi)
- Nessun salvataggio di credenziali, login solo con takeover attivo
- Cancellazione cronologia e logout globale con un clic
- Modalità supervisione per attività critiche (es. invio email, acquisti)
- Rifiuto automatico per task ad alto rischio (transazioni, ambiti legali, biochimici)
Performance nei benchmark
I risultati nei test sono notevoli:
- Humanity’s Last Exam: SOTA pass@1 al 44,4%
- DSBench (data science): l’agente ChatGPT supera GPT-4o, o3 e la media umana
- SpreadsheetBench: performance più che doppia rispetto a Copilot in Excel
- WebArena: accurato nel completamento di task agentici complessi
- BrowseComp: miglior risultato registrato nella raccolta di dati difficili da reperire online
- Task di investment banking: supera Deep Research e OpenAI o3 nella costruzione di modelli finanziari e LBO
Questi risultati non solo mostrano solidità tecnica, ma posizionano ChatGPT Agent come punto di riferimento nella categoria “agenti generalisti ad alta autonomia”.
Applicazioni nel mondo reale
L’adozione di ChatGPT Agent potrà rivoluzionare task comuni in diversi ambiti:
Business
- Creazione report e dashboard interattivi
- Automazione di processi documentali
- Aggiornamento di fogli Excel con formattazione mantenuta
- Gestione calendari, inbox e meeting
Personale
- Pianificazione e prenotazione viaggi
- Gestione lista spesa, pasti e ricette
- Ricerca specialisti e gestione appuntamenti
Sviluppo e IT
- Parsing documenti e log
- Scrittura e test di codice in ambiente controllato
- Task schedulati: “ogni lunedì alle 9 genera e invia il report vendite”
Come attivarlo
- Accedi a ChatGPT con un piano Pro, Plus o Team
- In qualunque chat, clic su Strumenti > Modalità agente
- Descrivi il compito (come se fosse un prompt normale)
- Guarda l’esecuzione in diretta (narrata)
- Interrompi, modifica, conferma, riprendi quando vuoi
Prompt da provare subito
- “Analizza le ultime 10 email in Gmail etichettate ‘clienti’ e fammi un report in tabella CSV”
- “Cerca voli economici per Berlino dal 5 all’8 ottobre e fammi un confronto”
- “Scarica i dati da questa tabella web, crea un grafico e mettilo in PowerPoint”
Disponibilità
Piano | Stato | Limite mensile |
---|---|---|
Pro | Attivo | 400 task |
Plus / Team | Rollout in corso | 40 task |
Enterprise / Edu | Entro luglio | TBD |
UE / Svizzera | Non ancora attivo | TBD |
Considerazioni finali
Onestamente? Io non aspettavo nemmeno più un rilascio del genere da OpenAI a luglio.
Con il silenzio sul modello open-source e la concorrenza che spingeva, sembrava che stessero tirando il fiato.
E invece no. Hanno rilasciato ChatGPT Agent e con questo hanno ricordato a tutti che il gioco non è finito. Anzi, forse è appena ricominciato.
Dal mio punto di vista, è il primo passo concreto verso un GPT-5 operativo, capace di orchestrare flussi, accedere a strumenti, generare output professionali e interagire col mondo reale non solo a parole.