Ricevi la newsletter
Tool, prompt e workflow AI. Una volta a settimana, gratis.
Sei dentro. Da questa settimana ricevi la newsletter.

Google ha rilasciato DiffusionGemma, un modello open sperimentale che non genera testo una parola alla volta, ma lavora su blocchi interi come fanno i modelli di diffusione con le immagini. Ecco cosa significa, perché è veloce e quali sono i suoi limiti.

MiniMax M3 è un modello AI open weight con contesto fino a 1 milione di token, multimodalità nativa e coding agentico. Cosa cambia davvero per dev e aziende, senza hype.

Caveman è la skill open source per Claude Code e altri agenti AI che comprime l’output fino al 75% e alleggerisce anche i file di memoria. Ecco come funziona davvero, quanto può far risparmiare e quando ha senso usarla.

Hai mai pensato che JSON ti stia costando il doppio in token? TOON è un formato che taglia del 30-60% i costi dei prompt mantenendo la struttura. Zero parentesi, zero virgolette, massima leggibilità. Scopri se conviene migrare →

MiniMax M2 spiegato semplice: cos’è, quanto costa e come usarlo con Ollama Cloud, OpenRouter e in self-host (vLLM/SGLang). Guida pratica + link e demo DeepSite.

La guida pratica a Qwen3-Omni. Scopri come provare via web, usare le API e scaricare il nuovo modello AI di Alibaba. Con esempi pratici e requisiti hardware.

Scopri Ollama Cloud, la rivoluzione per l'AI open source. Esegui modelli enormi come DeepSeek da 671B parametri senza GPU, direttamente dal cloud.

Scopri la nuova app desktop di Ollama. Gestisci LLM come Gemma e Llama con una UI semplice, analizza PDF e immagini in locale. La guida completa per iniziare.

Scopri Kimi K2, il modello AI open-source da 1 trilione di parametri, ottimizzato per agenti, tool digitali e coding avanzato. Ora disponibile su Hugging Face.