Gemini 3 e Antigravity: il nuovo modello di Google e l’IDE pensato per gli agenti

Gemini 3 ha superato GPT-5.1 e Claude nei benchmark chiave: reasoning, multimodalità, codice, agenti. È il modello più avanzato che Google abbia mai rilasciato. E con Antigravity Google introduce un IDE capace di lavorare in autonomia su codice, test e debugging. Se vuoi capire perché questo rilascio sta cambiando le carte in tavola, trovi tutto nell’articolo.

Il 18 novembre Google ha presentato due pezzi della stessa storia, ma con ruoli molto diversi: Gemini 3, il nuovo modello multimodale di punta, e Antigravity, un IDE costruito fin dall’inizio per essere usato dagli agenti.
Non è un semplice aggiornamento: è il primo passo concreto verso un mondo in cui l’AI non “suggerisce”, ma lavora dentro il progetto insieme a te, muovendosi tra editor, terminale e browser.

Negli ultimi mesi abbiamo visto tanti strumenti promettere automazione, reasoning, collaborazione. Questa volta, però, Google ha messo sul tavolo due componenti che si parlano davvero: un modello in grado di ragionare a lungo raggio e un editor pensato per lasciargli spazio operativo.

Ho testato Gemini 3 e Antigravity

Per capire davvero come lavorano insieme Gemini 3 Pro e il nuovo IDE Antigravity, ho registrato un test completo: 34 minuti in cui sviluppo un’app Full-Stack da zero, collego un database Supabase e lascio lavorare l’agente AI su codice, terminale e debug.

Se vuoi vedere il comportamento “sul campo” dell’IDE agentico prima di leggere l’analisi tecnica, qui trovi il video:

Nel video mostro anche i limiti, gli errori, e come l’agente corregge in autonomia durante il vibe coding. Se ti interessa il dietro le quinte con tutto il troubleshooting, fammelo sapere nei commenti: lo pubblicherò come contenuto extra solo qui sul sito.

Perché Gemini 3 è diverso dagli altri modelli

Gemini 3 nasce per ragionare, non solo per generare testo.
Google lo descrive come il suo modello più avanzato per reasoning, multimodalità e agentic performance, e dai benchmark si vede chiaramente.

Ti sta piacendo?

Ricevi una guida pratica ogni settimana. AI, tool e automazioni.

Risultati notevoli in molti settori:

  • Humanity’s Last Exam: 45.8% con strumenti
  • MMMU-Pro (multimodal understanding): 81%
  • Video-MMMU: 87.6%
  • ScreenSpot-Pro: 72.7% (nettamente sopra GPT-5.1 e Sonnet 4.5)
  • VendingBench-2 (task agentici a più fasi): 5.478$, contro i 1.473$ di GPT-5.1
Tabella dei benchmark di Gemini 3 Pro con confronto tra Gemini 2.5 Pro, Claude Sonnet 4.5 e GPT-5.1 su reasoning, coding, multimodalità e agentic performance.
Benchmark pubblici di Gemini 3 Pro: prestazioni nei test di ragionamento, coding autonomo, multimodalità e tool-use, confrontati con i principali modelli del 2025.

Il dato davvero interessante è questo ultimo benchmark: non misura la scrittura di codice, ma la capacità del modello di portare avanti autonomamente compiti lunghi, con scelte, errori, correzioni e strategia.
È esattamente quello che serve per un IDE agentico.

Multimodalità reale, non “dichiarata”

Gemini 3 lavora con:

  • testo
  • immagini
  • audio
  • video
  • interi repository di codice

E gestisce un contesto enorme, fino a 1 milione di token, con output fino a 64.000 token.

I costi API

Il pricing è molto chiaro:

  • Fino a 200k token:
    → $2 input
    → $12 output
  • Oltre 200k token:
    → $4 input
    → $18 output

È pensato per carichi enterprise, ma resterà competitivo anche per automazioni avanzate o workflow agentici.

Antigravity: l’IDE costruito per far lavorare l’AI dentro il tuo progetto

Gemini 3 serve come motore, ma senza un ambiente operativo sarebbe “solo” un grande modello.

Qui entra in gioco Antigravity.

Antigravity è un fork di VS Code, ma con una differenza sostanziale:
non è ottimizzato per scrivere codice più velocemente… ma per lasciare spazio agli agenti.

Cosa fa, in pratica?

Gli agenti possono:

  • leggere e modificare i file
  • usare il terminale
  • aprire un browser integrato
  • testare il progetto
  • correggere bug dopo averli visti, non solo dedotti
  • seguire piani multi-step senza micro-prompt

Il tutto con permessi espliciti, log visibili e artefatti chiari (diff, piani, test, registrazioni).

Due modalità che cambiano il flusso di lavoro

  • Editor View → la “classica” modalità tipo VS Code
  • Manager View → la cabina di controllo dove assegni obiettivi e monitori agenti che lavorano in parallelo

È un approccio che ricorda Cursor e Windsurf, ma con una differenza evidente:
qui l’agente non lavora “accanto” all’IDE, ma dentro l’IDE, coordinando superfici diverse come terminale e browser.

Anche Ollama ha già pubblicato Gemini 3 Pro

Un dettaglio curioso: Ollama ha aggiunto Gemini 3 Pro Preview nella propria libreria cloud, con supporto multimodale completo e contesto da 1M token.

Lo trovi qui:
https://ollama.com/library/gemini-3-pro-preview

Non è un modello scaricabile localmente (è marcato cloud), ma significa che:

  • è già integrabile
  • può essere testato tramite i workflow Ollama
  • funziona con tutto l’ecosistema che molti sviluppatori già usano (OpenWebUI, LM Studio, ecc.)

Ottimo per sperimentare se non vuoi aprire per forza l’IDE di Google.

Dove puoi usarli oggi

Gli strumenti sono già disponibili:

Gemini 3 su Google AI Studio
https://aistudio.google.com

Antigravity (IDE agentico)
https://antigravity.google/

Gemini 3 Pro Preview su Ollama (cloud)
https://ollama.com/library/gemini-3-pro-preview

→ Costi API Gemini 3 Pro: https://ai.google.dev/gemini-api/docs/pricing?hl=it

→ Guiida API: https://ai.google.dev/gemini-api/docs/gemini-3

Il rollout è ancora un po’ instabile: alcune funzioni compaiono, spariscono, poi tornano.
Classico Google quando rilascia qualcosa in anticipo.

Conclusione

L’impressione generale, usando Gemini 3 e Antigravity, è che Google abbia deciso di fare sul serio. Non stiamo parlando dell’ennesimo “assistente che completa il codice”, ma di un modello che riesce a muoversi nel progetto come un collaboratore vero, con un editor costruito apposta per farlo lavorare senza intralci.

Per chi sviluppa o automatizza processi, la novità non è tanto la potenza del modello, ma la continuità operativa: codice, terminale, browser integrato, piani di lavoro e correzioni visuali nello stesso posto. È un ambiente che prova a gestire attività complesse come un flusso unico, senza spezzettarle in dieci prompt.

Ollama che lo mette subito a disposizione in cloud dimostra quanto l’ecosistema si stia allargando rapidamente: non devi nemmeno aspettare Antigravity per testare il modello, puoi già usarlo nei tuoi workflow abituali.

Ci saranno limiti, instabilità, funzionalità che scompaiono per qualche ora—succede sempre nella fase preview.
Ma la direzione è chiara: stiamo entrando in un momento in cui gli IDE diventano ambienti condivisi tra sviluppatore e agente, e questo cambia il modo di progettare un’applicazione, fare debug o costruire automazioni.

Nei prossimi giorni registrerò un video dedicato, così posso mostrare i test reali e il comportamento del modello dentro Antigravity e nei miei flussi di lavoro. Appena è pronto aggiornerò questo articolo con il link.

Nuovo su Google

Aggiungi francescogruner.it come fonte preferita

Se leggi spesso i miei articoli su AI, automazione e tecnologia, ora puoi dire a Google che vuoi vedere più spesso i contenuti di francescogruner.it tra le notizie.

Francesco Gruner
Francesco Gruner

Sono un consulente IT, divulgatore e imprenditore tech. Mi occupo di automazione, AI e gestione di sistemi e infrastrutture IT, cercando soluzioni semplici a problemi complessi. Qui condivido strumenti, esperimenti e idee utili.