# Caveman per Claude Code: utile davvero o solo hype? > Fonte: https://francescogruner.it/caveman-claude-code-utile-davvero-o-solo-hype/ C’è un progetto open source che nelle ultime settimane ha fatto parecchio rumore nel mondo degli agenti AI: **Caveman**. L’idea è semplice e quasi assurda da raccontare: far parlare Claude Code come un cavernicolo per usare meno token. Il repository ufficiale lo presenta come una skill/plugin per Claude Code e come plugin per Codex, con claim di **~75% in meno sui token di output**, modalità multiple di compressione e un tool che riduce di **~46%** i token letti nei file di memoria come `CLAUDE.md`. Detta così sembra il classico meme tecnico destinato a vivere tre giorni. In realtà sotto c’è qualcosa di più interessante: **meno rumore, output più leggibile, risposte più secche** e, in alcuni casi, anche un possibile beneficio sulla qualità della risposta. Il punto però è capirlo bene, senza leggere quei numeri nel modo sbagliato. Indice dei contenuti [Toggle](#) - [Cos’è](#Cose) - [Come funziona](#Come_funziona) - [Ti sta piacendo?](#Ti_sta_piacendo) - [Il punto chiave](#Il_punto_chiave) - [Dove aiuta davvero](#Dove_aiuta_davvero) - [I benchmark](#I_benchmark) - [La parte più interessante: il paper](#La_parte_piu_interessante_il_paper) - [Quando usarlo](#Quando_usarlo) - [Quando no](#Quando_no) - [Installazione](#Installazione) - [Verdetto](#Verdetto) - [Fonti](#Fonti) ## **Cos’è** Caveman è un progetto open source di **Julius Brussee**. L’obiettivo è togliere tutto ciò che non serve nelle risposte dell’agente: filler, frasi di cortesia, giri larghi, spiegazioni prolisse. Il repo include modalità **lite**, **full**, **ultra** e perfino una modalità **文言文** in cinese classico, oltre a strumenti dedicati come `caveman-commit`, `caveman-review` e `caveman:compress`. Oggi il repository mostra circa **44.1k stelle** e **2.3k fork** su GitHub. [![Star History Chart](https://api.star-history.com/chart?repos=JuliusBrussee/caveman&type=date&legend=top-left)](https://www.star-history.com/?type=date&repos=JuliusBrussee%2Fcaveman) In pratica, invece di scrivere: > Ho analizzato il problema e il componente si ri-renderizza perché a ogni render viene creato un nuovo riferimento oggetto. Ti consiglio di usare useMemo. Caveman spinge verso qualcosa del genere: > New object ref each render. Inline object prop = new ref = re-render. Wrap in `useMemo`. Il significato resta quasi identico. **La differenza è il rumore.** ## **Come funziona** La cosa importante da capire è questa: **Caveman non cambia il cervello del modello**. Non tocca il reasoning, non tocca il codice generato, non trasforma Opus in un modello più economico. Lo dice anche il README in modo molto diretto: Caveman tocca gli **output tokens**, mentre i token di thinking/reasoning restano invariati. Il vantaggio principale, secondo il progetto stesso, è soprattutto in **leggibilità e velocità**, mentre il risparmio economico è un bonus. Questa distinzione conta tantissimo. Perché il claim “-75%” è vero **sulla parte giusta**, ma spesso viene capito male. ## Ti sta piacendo? Ricevi una guida pratica ogni settimana. AI, tool e automazioni. Iscriviti gratis Perfetto, sei dentro. ## **Il punto chiave** **No, non significa che l’intera sessione di Claude Code costi il 75% in meno.** Claude Code lavora leggendo file, usando strumenti, scrivendo codice, accumulando contesto, eseguendo comandi. Anthropic lo descrive proprio come uno strumento che opera sul progetto, modifica file, usa il terminale e si integra con l’ambiente di sviluppo. Caveman comprime soprattutto la **prosa finale**, cioè il modo in cui l’agente ti parla. Se in una sessione reale quella prosa è solo una parte del totale, il risparmio complessivo sarà **molto più basso** del numero da social. Non zero. Ma nemmeno miracoloso. Questa lettura è coerente sia con il posizionamento del progetto come **output compression skill**, sia con la nota del README secondo cui i token di reasoning non vengono toccati. ## **Dove aiuta davvero** Secondo me Caveman diventa interessante in tre scenari molto pratici. **1. Debug rapido** Se stai facendo fix lineari, refactor meccanici o review veloci, avere un agente che ti dice: > Expiry check wrong. Uses `<` not `<=`. Fix middleware. Update test. è spesso più utile di tre paragrafi pieni di educazione artificiale. **2. Meno frizione** Quando usi agenti AI tutto il giorno, il problema non è solo quanto spendi. È anche **quanto tempo perdi a leggere**. Qui Caveman può aiutare molto: meno scroll, meno contorno, più segnale. **3. Memory file più leggeri** La parte più sottovalutata del progetto, secondo me, è `caveman:compress`. Il tool riscrive file come `CLAUDE.md` in forma compressa, salva una copia leggibile in `CLAUDE.original.md` e lascia intatti codice, URL, path, comandi, heading, date e versioni. Nel README la media dichiarata è **46% di riduzione** su questi file. Esempio semplice. Versione classica: ``` Please avoid silent try/catch blocks. Always fail loudly. Use structured logging in production services and do not introduce console.log statements in src unless explicitly requested. ``` Versione compressa: ``` No silent try/catch. Fail loud. Use structured logging. No console.log in src unless asked. ``` L’umano capisce ancora tutto. L’agente legge meno testo. Se quel file viene caricato spesso, **il beneficio è reale**. ## **I benchmark** Il repo pubblica benchmark molto forti. Alcuni esempi: - **React re-render bug:** 1180 → 159 token, **87% in meno** - **Auth middleware token expiry:** 704 → 121, **83% in meno** - **PostgreSQL race condition:** 1200 → 232, **81% in meno** - **Media:** 1214 → 294, cioè **65% di risparmio** nei prompt testati La parte positiva è che il progetto prova anche a misurare la cosa in modo un po’ più serio del classico “prima verbose, dopo breve”. Nel README si parla di un **three-arm eval harness** nella cartella `evals/`, pensato per confrontare Caveman anche contro un controllo più corretto e non solo contro Claude prolisso. Quindi sì, dietro il meme c’è un tentativo di misurazione reale. Ma quei benchmark restano benchmark: **non equivalgono automaticamente al risparmio reale della tua settimana di lavoro**. ## **La parte più interessante: il paper** Qui il discorso diventa più serio. Caveman cita il paper **“Brevity Constraints Reverse Performance Hierarchies in Language Models”**, pubblicato su arXiv nel marzo 2026. Il lavoro riporta esperimenti su **31 modelli** e **1.485 problemi** e conclude che imporre vincoli di brevità può **migliorare l’accuratezza dei modelli grandi di circa 26 punti percentuali** su alcuni benchmark, riducendo anche i gap di performance. Gli autori parlano di un problema di **prolissità spontanea**: modelli grandi che si dilungano troppo e, così facendo, peggiorano la risposta. Attenzione però: questo **non prova** che Caveman migliori sempre Claude Code nel coding reale. Ma dà una base molto interessante a un’intuizione che tanti sviluppatori hanno già: **più parole non significa sempre più qualità**. ## **Quando usarlo** Io lo vedo bene qui: - **debug lineare** - **review veloci** - **refactor meccanici** - **commit message** - **handoff sintetici** - **workflow multi-agent** dove vuoi meno rumore nel passaggio di contesto ## **Quando no** Non lo terrei sempre acceso su: - onboarding a framework nuovi - ragionamento architetturale - documentazione - spiegazioni da condividere con colleghi - task dove il **perché** conta più della sola risposta In quei casi, comprimere troppo rischia di togliere proprio il pezzo utile. ## **Installazione** Su **Claude Code**: ``` claude plugin marketplace add JuliusBrussee/cavemanclaude plugin install caveman@caveman ``` Su **Cursor**: ``` npx skills add JuliusBrussee/caveman -a cursor ``` Su **Gemini CLI**: ``` gemini extensions install https://github.com/JuliusBrussee/caveman ``` Il README indica supporto anche per **Codex, Windsurf, Copilot, Cline** e altri agenti. L’auto-attivazione è integrata per **Claude Code**, **Gemini CLI** e per la configurazione locale di **Codex** nel repo; su altri ambienti spesso serve aggiungere regole o instruction file. ## **Verdetto** **Caveman non è una magia. Ma non è neanche solo hype.** Se qualcuno lo presenta come il trucco definitivo per abbattere del 75% qualsiasi flusso in Claude Code, sta forzando troppo il messaggio. Se invece lo guardi per quello che è davvero, il progetto ha senso: - **riduce la verbosità** - **alleggerisce la lettura** - **può aiutare la qualità** in alcuni task - **rende più utili** i file di memoria compressi - impone una disciplina interessante sul modo in cui l’agente comunica In altre parole: **non rende Claude più intelligente, ma in molti casi lo rende più utile**. ## **Fonti** - [**Repository ufficiale Caveman**](https://github.com/JuliusBrussee/caveman) - **Paper: [Brevity Constraints Reverse Performance Hierarchies in Language Models](https://arxiv.org/abs/2604.00025)** - **[Claude Code Docs overview](https://code.claude.com/docs/en/overview)**