# Come usare Claude Cowork 3P con QUALSIASI modello AI (DeepSeek, Minimax, Ollama) > Fonte: https://francescogruner.it/claude-cowork-3p-modelli-terze-parti/ Se sei arrivato qui dal video, sai già di cosa parliamo. Sotto trovi i tre file di configurazione (DeepSeek, Minimax, Z.ai GLM) pronti da incollare, le istruzioni del proxy per Ollama Cloud, e i link a tutta la documentazione ufficiale. Se invece sei capitato qui senza aver visto il video, ti consiglio di partire da quello: la parte visiva (dove cliccare, come si presenta Cowork in modalità 3P, le demo dal vivo) è molto più chiara guardandola che leggendola. Sotto trovi comunque tutto. > 🐙 **Repo del proxy:** [github.com/francescogruner/claude-3p-ollama-proxy](https://github.com/francescogruner/claude-3p-ollama-proxy) Indice dei contenuti [Toggle](#) - [Cowork 3P in trenta secondi](#Cowork_3P_in_trenta_secondi) - [Cosa è cambiato negli ultimi giorni](#Cosa_e_cambiato_negli_ultimi_giorni) - [Ti sta piacendo?](#Ti_sta_piacendo) - [I quattro percorsi](#I_quattro_percorsi) - [Setup base](#Setup_base) - [DeepSeek](#DeepSeek) - [Minimax](#Minimax) - [Z.ai (GLM)](#Zai_GLM) - [Ollama Cloud (con il proxy)](#Ollama_Cloud_con_il_proxy) - [Come funziona](#Come_funziona) - [Installazione](#Installazione) - [Avvio su Windows PowerShell](#Avvio_su_Windows_PowerShell) - [Avvio su macOS / Linux](#Avvio_su_macOS_Linux) - [Configurazione lato Claude Desktop](#Configurazione_lato_Claude_Desktop) - [Health check](#Health_check) - [Una nota tecnica](#Una_nota_tecnica) - [Cosa funziona e cosa no in modalità 3P](#Cosa_funziona_e_cosa_no_in_modalita_3P) - [Una nota onesta sulla privacy](#Una_nota_onesta_sulla_privacy) - [Risorse](#Risorse) ## Cowork 3P in trenta secondi Cowork 3P è una modalità di Claude Desktop che fa girare l’inferenza fuori dall’infrastruttura Anthropic. È pensata per le aziende che usano Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry o un gateway LLM interno. Il punto è semplice: i prompt e le risposte non passano mai dai server Anthropic, e di conseguenza l’app diventa utilizzabile in scenari prima bloccati per ragioni di compliance, GDPR o residenza del dato. L’opzione che useremo si chiama **Gateway personalizzato**: accetta qualsiasi endpoint che parli l’API Anthropic. Documentazione ufficiale: - [Anthropic Help Center (italiano)](https://support.claude.com/it/articles/14680729-usa-claude-cowork-con-piattaforme-di-terze-parti) - [Cowork on 3P — Claude Docs](https://claude.com/docs/cowork/3p/overview) ## Cosa è cambiato negli ultimi giorni Per qualche settimana 3P era piuttosto permissiva. Le bastava un baseURL e una chiave API per accettare praticamente qualunque modello con API Anthropic-compatible. Anche Ollama aveva rilasciato un suo lanciatore dedicato (Ollama Launch Cloud Desktop) che pre-configurava tutto. Poi pochi giorni fa Anthropic ha aggiunto un controllo sul nome del modello. Adesso il backend si aspetta alias come `claude-sonnet-4-5` o `claude-haiku-4-5`. Se gli passi `gemma4:31b-cloud` direttamente, ti risponde `model not found`. Ollama, di conseguenza, ha tolto la sua funzione di lancio. Non è la fine. Provider come DeepSeek, Minimax e Z.ai espongono già endpoint che accettano alias Anthropic e li mappano internamente al loro modello. Funzionano direttamente, senza nessun proxy. Ollama Cloud invece no — e per quello ho dovuto scrivere il proxy che vedi su GitHub. ## Ti sta piacendo? Ricevi una guida pratica ogni settimana. AI, tool e automazioni. Iscriviti gratis Perfetto, sei dentro. ## I quattro percorsi ProviderConfigurazione direttaProxy necessarioNote**DeepSeek**SìNoEndpoint Anthropic-compatible, ricarica via API**Minimax**SìNoAnthropic-compatible, supporta tools/thinking, credito API minimo 25 USD**Z.ai (GLM)**SìNoAnthropic-compatible, richiede GLM Coding Plan attivo**Ollama Cloud**InstabileSìDiscovery del modello fallisce, serve il proxy Tutte e quattro le configurazioni le ho testate il 9 maggio 2026. Se leggi questo articolo tra qualche settimana e qualcosa non funziona più, fammelo sapere nei commenti del video. ## Setup base Vale per tutti i provider, fai questi tre passi una volta sola. 1. Apri Claude Desktop 2. In alto a destra clicca sul **menu hamburger** → **Sviluppatore** → **Configura inferenza di terze parti** 3. Nella modal scegli “Gateway personalizzato” Quando applichi e fai click su **Applica localmente**, l’app si riavvia in modalità 3P. Te ne accorgi perché: - la tab Chat sparisce, restano solo Cowork e Code - in basso a sinistra compare il badge `Cowork 3P · Gateway` - skills, plugins, connettori e progetti ripartono da zero (vanno reimportati) Il file di configurazione viene salvato qui: ``` %APPDATA%\Local\Cloud-3P\config.json ``` Su macOS o Linux equivale a `~/.config/Cloud-3P/`. Puoi modificarlo direttamente con un editor di testo: tutti i config qui sotto vanno incollati lì. ## DeepSeek Genera la chiave API dalla dashboard DeepSeek → API keys → Create new key. Per i primi test bastano 2-5 dollari di credito, le tariffe sono basse. ``` { "preferences": { "coworkScheduledTasksEnabled": true, "ccdScheduledTasksEnabled": false, "sidebarMode": "task", "coworkWebSearchEnabled": true, "epitaxyPrefs": { "starred-local-code-sessions": [] } }, "deploymentMode": "3p", "providers": [ { "id": "deepseek", "displayName": "DeepSeek AI", "type": "custom", "apiKey": "LA_TUA_DEEPSEEK_API_KEY", "baseUrl": "https://api.deepseek.com/anthropic", "inferenceModels": [ { "id": "anthropic/claude-sonnet-4-5", "providerModelId": "deepseek-v4-flash", "displayName": "DeepSeek V4 Flash" } ] } ] } ``` Salva, fai Applica localmente, riavvia. Quando apri una nuova task vedi `Sonnet 4.5` come modello selezionato, ma sotto il cofano stai parlando con DeepSeek V4 Flash. Se al modello chiedi “che modello sei”, ti dirà di essere Claude — il filtro sul nome modello viene applicato anche al prompt. ## Minimax Minimax è quello che, nei miei test, restituisce risultati più vicini a Claude. Costa una frazione delle API ufficiali e supporta tools, thinking e tutto il workflow agentico. Richiede un credito minimo iniziale di 25 dollari. ``` { "preferences": { "coworkScheduledTasksEnabled": true, "ccdScheduledTasksEnabled": false, "sidebarMode": "task", "coworkWebSearchEnabled": true, "epitaxyPrefs": { "starred-local-code-sessions": [] } }, "deploymentMode": "3p", "providers": [ { "id": "minimax", "displayName": "MiniMax", "type": "custom", "apiKey": "LA_TUA_MINIMAX_API_KEY", "baseUrl": "https://api.minimax.io/anthropic", "inferenceModels": [ { "id": "anthropic/claude-sonnet-4-5", "providerModelId": "MiniMax-M2.7", "displayName": "MiniMax M2.7" }, { "id": "anthropic/claude-haiku-4-5", "providerModelId": "MiniMax-M2.7-highspeed", "displayName": "MiniMax M2.7 Highspeed" }, { "id": "anthropic/claude-opus-4-5", "providerModelId": "MiniMax-M2.7", "displayName": "MiniMax M2.7 Opus Route" } ] } ] } ``` Qui ho mappato anche Haiku e Opus, così nel selettore modelli ne hai tre. Utile se vuoi simulare scenari con costi diversi senza cambiare provider. ## Z.ai (GLM) GLM funziona un po’ come Anthropic stessa: oltre alla chiave API serve un **GLM Coding Plan** attivo (è un abbonamento di pochi dollari al mese). Solo la chiave non basta per usarlo dentro strumenti di sviluppo come Cowork. Una volta attivato il piano, GLM 4.7 è potente sul coding. ``` { "preferences": { "coworkScheduledTasksEnabled": true, "ccdScheduledTasksEnabled": false, "sidebarMode": "task", "coworkWebSearchEnabled": true, "epitaxyPrefs": { "starred-local-code-sessions": [] } }, "deploymentMode": "3p", "providers": [ { "id": "zai-glm", "displayName": "Z.ai GLM", "type": "custom", "apiKey": "LA_TUA_ZAI_API_KEY", "baseUrl": "https://api.z.ai/api/anthropic", "inferenceModels": [ { "id": "anthropic/claude-sonnet-4-5", "providerModelId": "glm-4.7", "displayName": "GLM 4.7" }, { "id": "anthropic/claude-haiku-4-5", "providerModelId": "glm-4.5-air", "displayName": "GLM 4.5 Air" }, { "id": "anthropic/claude-opus-4-5", "providerModelId": "glm-4.7", "displayName": "GLM 4.7 Opus Route" } ] } ] } ``` ## Ollama Cloud (con il proxy) Qui la cosa si complica e per questo ho dovuto scrivere un piccolo proxy. Il problema è che Claude Desktop, in modalità 3P, fa una discovery dei modelli chiamando `/v1/models`. Ollama risponde con i suoi nomi nativi (`gemma4:31b-cloud`, `gpt-oss:120b-cloud`). Poi Claude però prova a richiamarli usando alias `claude-sonnet-4-5-20250929`, e Ollama risponde `model not found`. Il proxy si mette in mezzo: espone gli alias Anthropic verso Claude e riscrive il nome modello prima di inoltrare la richiesta a Ollama. Una sessantina di righe Node.js, zero dipendenze esterne, MIT license. Repo: [github.com/francescogruner/claude-3p-ollama-proxy](https://github.com/francescogruner/claude-3p-ollama-proxy) ### Come funziona ``` Claude Desktop / Cowork ↓http://localhost:8787 (proxy) ↓https://ollama.com/v1/messages ``` Il mapping di default: ``` claude-sonnet-4-5-20250929 → gemma4:31b-cloudclaude-haiku-4-5-20251001 → gpt-oss:120b-cloud ``` Lo puoi cambiare con variabili d’ambiente (`MODEL_SONNET`, `MODEL_HAIKU`, `DEFAULT_MODEL`). ### Installazione Servono Node.js 18+ e una chiave API di Ollama Cloud. ``` git clone https://github.com/francescogruner/claude-3p-ollama-proxy.git cd claude-3p-ollama-proxy ``` Niente `npm install`: il proxy usa solo moduli built-in di Node. ### Avvio su Windows PowerShell ``` $env:OLLAMA_API_KEY="LA_TUA_OLLAMA_API_KEY" node server.js ``` ### Avvio su macOS / Linux ``` export OLLAMA_API_KEY="LA_TUA_OLLAMA_API_KEY" node server.js ``` Quando parte, in console leggi: ``` Proxy attivo su http://localhost:8787Upstream: https://ollama.comModelli esposti a Claude:[ 'claude-sonnet-4-5-20250929', 'claude-haiku-4-5-20251001' ]Mapping verso Ollama:{ 'claude-sonnet-4-5-20250929': 'gemma4:31b-cloud', 'claude-haiku-4-5-20251001': 'gpt-oss:120b-cloud'}Default: gemma4:31b-cloud ``` ### Configurazione lato Claude Desktop In **Sviluppatore → Configura inferenza di terze parti** scegli Gateway personalizzato e imposta: - **Gateway base URL**: `http://localhost:8787` - **Gateway API key**: `ollama-proxy` (qualsiasi stringa, è solo per superare il check) - **Auth scheme**: `bearer` - **Model list**: lascia vuoto Lasciare la lista vuota è importante: così Claude Desktop chiama `/v1/models` sul proxy e scopre da solo gli alias. ### Health check Mentre il proxy è in esecuzione, in un altro tab del browser apri: ``` http://localhost:8787/health ``` Risposta attesa: ``` { "ok": true, "proxy": "claude-desktop-to-ollama-anthropic-proxy", "upstream": "https://ollama.com", "exposedModels": [ "claude-sonnet-4-5-20250929", "claude-haiku-4-5-20251001" ]} ``` ### Una nota tecnica Il proxy non converte OpenAI chat completions in formato Anthropic. Si limita a riscrivere il nome del modello e a inoltrare il payload tale e quale. Funziona perché Ollama Cloud espone già `/v1/messages` Anthropic-compatible. Per provider che parlano solo OpenAI-style servirebbe una traduzione completa, e quella tipicamente rompe i flussi avanzati di Claude (`tool_use`, `tool_result`, streaming, MCP). Ho preferito tenere il proxy semplice e affidabile per il caso Ollama, che è quello che mi serviva. ## Cosa funziona e cosa no in modalità 3P **Funzionano:** - task a lunga esecuzione - accesso al file system locale e cartelle di lavoro - connettori MCP locali e remoti - skills (vanno reimportate dalla versione standard, l’export funziona) - plugins (idem) - schedulazione delle attività (l’app deve restare aperta) - memoria locale **Non funzionano:** - la tab Chat - la condivisione progetti tra utenti - Dispatch - mobile app e modalità vocale - Claude in Chrome - computer use - marketplace di skills e plugins La ricerca web nativa non gira con tutti i provider terze parti (ufficialmente è supportata su Vertex e Azure). Ti basta collegare un MCP server tipo FireCrawl per replicare lo stesso comportamento. ## Una nota onesta sulla privacy Vale la pena dirlo chiaramente: la modalità 3P è nata per **non** far uscire i tuoi dati dall’infrastruttura che controlli. Ha senso quando “infrastruttura che controlli” significa la tua VPC su AWS, il tuo tenant Vertex AI con regione EU, o un gateway LLM aziendale. Quando configuri DeepSeek o Minimax come provider, i tuoi prompt finiscono sui server di DeepSeek o Minimax (in Cina). Il vantaggio originale di sovranità del dato decade. Quello che ottieni in cambio è accesso a modelli potenti a una frazione del costo, e la possibilità di usare Cowork senza un abbonamento Anthropic Pro. Sono due use case completamente diversi. Decidi tu quale è il tuo: - Se ti serve **governance del dato**: paga le API Anthropic ufficiali, oppure usa la modalità 3P con Bedrock, Vertex o Azure. - Se vuoi **Cowork con modelli economici per progetti personali**: i provider terzi vanno benissimo, sapendo che il dato esce dalla tua sfera di controllo. Io personalmente uso entrambi gli approcci a seconda del progetto. Per cose mie sperimentali Minimax è il mio preferito in questo momento. ## Risorse - 📺 **Video YouTube** con la demo completa: [link al video](https://markdowntohtml.com/#) - 🐙 **Repo del proxy Ollama**: [github.com/francescogruner/claude-3p-ollama-proxy](https://github.com/francescogruner/claude-3p-ollama-proxy) - 📄 **Guida Anthropic (italiano)**: [Usa Claude Cowork con piattaforme di terze parti](https://support.claude.com/it/articles/14680729-usa-claude-cowork-con-piattaforme-di-terze-parti) - 📚 **Documentazione tecnica Cowork 3P**: [Cowork on 3P Overview](https://claude.com/docs/cowork/3p/overview) Cowork 3P è una funzione che evolve di settimana in settimana. Quello che oggi funziona potrebbe non funzionare più tra un po’, oppure potrebbero aprirsi nuovi scenari che oggi sono bloccati. Se quando leggi qualcosa è cambiato, fammelo sapere nei commenti del video o aprimi una issue su GitHub. Se l’articolo ti è stato utile, [iscriviti alla newsletter](https://francescogruner.it): ogni venerdì ti mando un riassunto pratico delle novità AI che valgono il tempo di leggere.