# Google Gemma 4: l’AI open source che cambia davvero l’uso in locale > Fonte: https://francescogruner.it/gemma-4-ai-open-source-locale/ **Gemma 4 è finalmente uscito**, e questa volta non è il classico rilascio che guardi per curiosità e dimentichi dopo qualche giorno. Google DeepMind ha preso quello che ha costruito con i modelli Gemini e lo ha portato nel mondo dei **modelli AI open source** con un approccio molto più concreto del solito. Se fino a ieri gli open model erano spesso “buoni ma limitati”, qui iniziamo a vedere qualcosa di diverso: un modello pensato per lavorare davvero dentro sistemi, agent e automazioni. E soprattutto, progettato per funzionare anche **in locale**. Indice dei contenuti [Toggle](#) - [Oltre la chat: cambia il modo di usare l’intelligenza artificiale](#Oltre_la_chat_cambia_il_modo_di_usare_lintelligenza_artificiale) - [Gemma 4 benchmark: il salto è reale (e si vede anche nei test)](#Gemma_4_benchmark_il_salto_e_reale_e_si_vede_anche_nei_test) - [Ti sta piacendo?](#Ti_sta_piacendo) - [Multimodalità e test reali: dove sorprende davvero](#Multimodalita_e_test_reali_dove_sorprende_davvero) - [Architettura: Edge, Dense e MoE (qui Google ha fatto centro)](#Architettura_Edge_Dense_e_MoE_qui_Google_ha_fatto_centro) - [Il punto chiave: AI in locale e meno vendor lock-in](#Il_punto_chiave_AI_in_locale_e_meno_vendor_lock-in) - [Come provare Gemma 4 (subito)](#Come_provare_Gemma_4_subito) - [Conclusione](#Conclusione) ## **Oltre la chat: cambia il modo di usare l’intelligenza artificiale** Sulla carta, **Gemma 4** ha tutte le caratteristiche che oggi ci aspettiamo: - supporto multimodale (testo, immagini e audio) - fino a **256K token di contesto** - oltre **140 lingue supportate** Ma la differenza non è qui. La differenza è che questo modello è stato chiaramente progettato per **fare cose**, non solo per rispondere bene. Dai primi test emerge un comportamento molto più “operativo” rispetto ai classici chatbot: pianifica, utilizza strumenti, genera output strutturati e si integra bene in workflow reali. È molto più vicino a un sistema come Claude Code che a una semplice chat. Con un vantaggio non banale: → **non sei obbligato a passare da API esterne** ## **Gemma 4 benchmark: il salto è reale (e si vede anche nei test)** Guardando i numeri, il miglioramento rispetto alla generazione precedente è netto. - matematica (AIME) → ~89% - coding (LiveCodeBench) → ~80% - Codeforces → ~2150 ELO Ma la cosa interessante è che **non resta nei benchmark**. Nei test reali il modello: - gestisce bene problemi logici e scenari complessi - pianifica correttamente attività nel tempo - genera codice strutturato e utilizzabile Sul coding in particolare si vede il salto: non si limita più a snippet, ma costruisce interfacce, pagine e simulazioni con una coerenza che, fino a poco tempo fa, era difficile trovare negli open model. ## Ti sta piacendo? Ricevi una guida pratica ogni settimana. AI, tool e automazioni. Iscriviti gratis Perfetto, sei dentro. ## **Multimodalità e test reali: dove sorprende davvero** Uno degli aspetti più interessanti è la tenuta sui modelli piccoli. Le versioni più leggere riescono già a: - fare OCR da immagini - analizzare screenshot complessi - estrarre testo e contesto Questo apre scenari concreti per: → **document AI locale** → automazioni su file e immagini → applicazioni su mobile Non è perfetto, ovviamente. Errori su task banali (tipo conteggi) ci sono ancora, e qualche comportamento strano sull’audio è stato segnalato. Ma il punto è un altro: → **funziona bene dove serve davvero** ## **Architettura: Edge, Dense e MoE (qui Google ha fatto centro)** Gemma 4 non è un modello unico, ma una famiglia ben pensata. Le versioni **E2B ed E4B** sono progettate per **AI su smartphone e dispositivi locali**. Sono leggere, multimodali e funzionano offline. Perfette per agent locali o sistemi embedded. Salendo troviamo i modelli **26B e 31B**, pensati per workstation e GPU consumer. Qui spicca il **26B MoE (Mixture of Experts)**: → attiva solo una parte dei parametri → mantiene qualità alta → riduce costi e latenza È probabilmente il modello più interessante per chi vuole costruire sistemi reali senza dover usare infrastrutture enormi. ## **Il punto chiave: AI in locale e meno vendor lock-in** Al di là della parte tecnica, il vero impatto è questo. Con **Gemma 4** diventa realistico costruire sistemi di **intelligenza artificiale in locale** senza dipendere completamente da provider esterni. Questo significa: - dati sotto controllo - maggiore compatibilità con compliance (ISO, GDPR, ecc.) - costi più prevedibili per SaaS - meno dipendenza da API Il cloud non sparisce, ma smette di essere l’unica opzione. ## **Come provare Gemma 4 (subito)** Se vuoi testarlo velocemente, puoi partire da qui: 👉 Google AI Studio [https://aistudio.google.com/prompts/new_chat?model=gemma-4-31b-it](https://aistudio.google.com/prompts/new_chat?model=gemma-4-31b-it) Se invece vuoi usarlo davvero in locale, il modo più semplice è [Ollama](https://ollama.com/library/gemma4): ![Gemma 4 eseguito con Ollama in locale tramite comando ollama run gemma4](https://francescogruner.it/wp-content/uploads/2026/04/Gemma-4-su-Ollama-installazione-e-avvio-in-locale.png) Eseguire Gemma 4 in locale con Ollama è immediato: basta un comando per avviare il modello e integrarlo con agent e tool. ``` ollama run gemma4 ``` Oppure: ``` ollama run gemma4:e2bollama run gemma4:26bollama run gemma4:31b ``` Per ambienti più avanzati puoi integrarlo con vLLM o Transformers. ## **Conclusione** **Gemma 4 non è interessante perché è “un buon modello”.** È interessante perché: → porta capacità avanzate fuori dal cloud → rende l’AI locale una scelta reale, non un compromesso → apre scenari concreti per agent, SaaS e automazioni Non è ancora perfetto e serviranno test più approfonditi. Ma una cosa è chiara: → **gli open model non sono più una seconda scelta**