Ricevi la newsletter
Tool, prompt e workflow AI. Una volta a settimana, gratis.
Sei dentro. Da questa settimana ricevi la newsletter.
OpenAI ha aggiornato la Modalità Voce di ChatGPT per gli utenti paganti, rendendola più naturale, espressiva e adatta a conversazioni fluide. Le nuove voci (come Sky e Juniper) offrono intonazione realistica, pause migliorate e traduzione simultanea.

OpenAI ha annunciato un aggiornamento importante alla Modalità Voce di ChatGPT, disponibile esclusivamente per gli utenti paganti (Plus, Pro, Team, Enterprise) e solo all’interno dell’app ufficiale ChatGPT (sia desktop che mobile).
Questo aggiornamento punta a rendere le conversazioni vocali molto più naturali, coinvolgenti e utili, sia per uso personale che professionale. L’ho provato personalmente e in questo articolo ti spiego cosa cambia, cosa funziona bene e dove ci sono ancora margini di miglioramento.
Ecco le principali migliorie introdotte:
Le nuove voci migliorate sono:
Queste voci sono state progettate per offrire maggiore espressività e realismo, ma sono disponibili solo nell’app ChatGPT. Non possono ancora essere utilizzate via API.
Ricevi una guida pratica ogni settimana. AI, tool e automazioni.
Chi lavora con l’integrazione vocale via API deve sapere che, al momento, le voci disponibili su API sono ancora:
tts-1tts-1-hdQueste non offrono la stessa gamma di intonazioni, espressività o ritmo naturale delle nuove voci presenti nell’app. OpenAI ha dichiarato l’intenzione di estendere le funzionalità anche via API in futuro, ma al momento non è ancora possibile usare Sky & co. al di fuori dell’applicazione. Questo significa che l’integrazione di queste voci in progetti personalizzati potrebbe essere implementata, ovviamente salvo rilascio delle API aggiornate.
Molti utenti in rete stanno confrontando il nuovo Voice Mode di ChatGPT con strumenti come Gemini Live di Google. A livello tecnico, ChatGPT utilizza un approccio speech-to-speech, mantenendo inflessioni, accenti, pause e persino ritmo emotivo, mentre Gemini al momento funziona con un modello speech-to-text-to-speech, che perde parte dell’espressività originaria.
In base ai miei test, ChatGPT offre una performance più naturale e coinvolgente, soprattutto quando si chiede di recitare con un certo tono, di interpretare emozioni o di adattarsi a contesti diversi.
Questa nuova modalità vocale si presta molto bene a:
Nonostante i progressi, ci sono ancora alcune limitazioni:
Il nuovo aggiornamento alla Modalità Voce di ChatGPT segna un passo importante verso l’adozione di interfacce vocali più naturali e potenti.
Se lavori con AI conversazionale, esperienze utente o stai sviluppando soluzioni vocali, ti consiglio di provarla direttamente dall’app.
Ti interessa l’argomento? Scrivimi nei commenti, oppure condividi l’articolo con chi potrebbe trovare utile questo aggiornamento.