Come usare Claude Cowork 3P con QUALSIASI modello AI (DeepSeek, Minimax, Ollama)

Configurazioni complete e proxy open source per usare Claude Cowork 3P con DeepSeek, Minimax, Z.ai GLM e Ollama Cloud. File pronti da incollare.

Se sei arrivato qui dal video, sai già di cosa parliamo. Sotto trovi i tre file di configurazione (DeepSeek, Minimax, Z.ai GLM) pronti da incollare, le istruzioni del proxy per Ollama Cloud, e i link a tutta la documentazione ufficiale.

Se invece sei capitato qui senza aver visto il video, ti consiglio di partire da quello: la parte visiva (dove cliccare, come si presenta Cowork in modalità 3P, le demo dal vivo) è molto più chiara guardandola che leggendola. Sotto trovi comunque tutto.

🐙 Repo del proxy: github.com/francescogruner/claude-3p-ollama-proxy

Cowork 3P in trenta secondi

Cowork 3P è una modalità di Claude Desktop che fa girare l’inferenza fuori dall’infrastruttura Anthropic. È pensata per le aziende che usano Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry o un gateway LLM interno. Il punto è semplice: i prompt e le risposte non passano mai dai server Anthropic, e di conseguenza l’app diventa utilizzabile in scenari prima bloccati per ragioni di compliance, GDPR o residenza del dato.

L’opzione che useremo si chiama Gateway personalizzato: accetta qualsiasi endpoint che parli l’API Anthropic.

Documentazione ufficiale:

Cosa è cambiato negli ultimi giorni

Per qualche settimana 3P era piuttosto permissiva. Le bastava un baseURL e una chiave API per accettare praticamente qualunque modello con API Anthropic-compatible. Anche Ollama aveva rilasciato un suo lanciatore dedicato (Ollama Launch Cloud Desktop) che pre-configurava tutto.

Poi pochi giorni fa Anthropic ha aggiunto un controllo sul nome del modello. Adesso il backend si aspetta alias come claude-sonnet-4-5 o claude-haiku-4-5. Se gli passi gemma4:31b-cloud direttamente, ti risponde model not found. Ollama, di conseguenza, ha tolto la sua funzione di lancio.

Non è la fine. Provider come DeepSeek, Minimax e Z.ai espongono già endpoint che accettano alias Anthropic e li mappano internamente al loro modello. Funzionano direttamente, senza nessun proxy. Ollama Cloud invece no — e per quello ho dovuto scrivere il proxy che vedi su GitHub.

Ti sta piacendo?

Ricevi una guida pratica ogni settimana. AI, tool e automazioni.

I quattro percorsi

ProviderConfigurazione direttaProxy necessarioNote
DeepSeekNoEndpoint Anthropic-compatible, ricarica via API
MinimaxNoAnthropic-compatible, supporta tools/thinking, credito API minimo 25 USD
Z.ai (GLM)NoAnthropic-compatible, richiede GLM Coding Plan attivo
Ollama CloudInstabileDiscovery del modello fallisce, serve il proxy

Tutte e quattro le configurazioni le ho testate il 9 maggio 2026. Se leggi questo articolo tra qualche settimana e qualcosa non funziona più, fammelo sapere nei commenti del video.

Setup base

Vale per tutti i provider, fai questi tre passi una volta sola.

  1. Apri Claude Desktop
  2. In alto a destra clicca sul menu hamburger → Sviluppatore → Configura inferenza di terze parti
  3. Nella modal scegli “Gateway personalizzato”

Quando applichi e fai click su Applica localmente, l’app si riavvia in modalità 3P. Te ne accorgi perché:

  • la tab Chat sparisce, restano solo Cowork e Code
  • in basso a sinistra compare il badge Cowork 3P · Gateway
  • skills, plugins, connettori e progetti ripartono da zero (vanno reimportati)

Il file di configurazione viene salvato qui:

%APPDATA%\Local\Cloud-3P\config.json

Su macOS o Linux equivale a ~/.config/Cloud-3P/. Puoi modificarlo direttamente con un editor di testo: tutti i config qui sotto vanno incollati lì.

DeepSeek

Genera la chiave API dalla dashboard DeepSeek → API keys → Create new key. Per i primi test bastano 2-5 dollari di credito, le tariffe sono basse.

{
  "preferences": {
    "coworkScheduledTasksEnabled": true,
    "ccdScheduledTasksEnabled": false,
    "sidebarMode": "task",
    "coworkWebSearchEnabled": true,
    "epitaxyPrefs": {
      "starred-local-code-sessions": []
    }
  },
  "deploymentMode": "3p",
  "providers": [
    {
      "id": "deepseek",
      "displayName": "DeepSeek AI",
      "type": "custom",
      "apiKey": "LA_TUA_DEEPSEEK_API_KEY",
      "baseUrl": "https://api.deepseek.com/anthropic",
      "inferenceModels": [
        {
          "id": "anthropic/claude-sonnet-4-5",
          "providerModelId": "deepseek-v4-flash",
          "displayName": "DeepSeek V4 Flash"
        }
      ]
    }
  ]
}

Salva, fai Applica localmente, riavvia. Quando apri una nuova task vedi Sonnet 4.5 come modello selezionato, ma sotto il cofano stai parlando con DeepSeek V4 Flash. Se al modello chiedi “che modello sei”, ti dirà di essere Claude — il filtro sul nome modello viene applicato anche al prompt.

Minimax

Minimax è quello che, nei miei test, restituisce risultati più vicini a Claude. Costa una frazione delle API ufficiali e supporta tools, thinking e tutto il workflow agentico. Richiede un credito minimo iniziale di 25 dollari.

{
  "preferences": {
    "coworkScheduledTasksEnabled": true,
    "ccdScheduledTasksEnabled": false,
    "sidebarMode": "task",
    "coworkWebSearchEnabled": true,
    "epitaxyPrefs": {
      "starred-local-code-sessions": []
    }
  },
  "deploymentMode": "3p",
  "providers": [
    {
      "id": "minimax",
      "displayName": "MiniMax",
      "type": "custom",
      "apiKey": "LA_TUA_MINIMAX_API_KEY",
      "baseUrl": "https://api.minimax.io/anthropic",
      "inferenceModels": [
        {
          "id": "anthropic/claude-sonnet-4-5",
          "providerModelId": "MiniMax-M2.7",
          "displayName": "MiniMax M2.7"
        },
        {
          "id": "anthropic/claude-haiku-4-5",
          "providerModelId": "MiniMax-M2.7-highspeed",
          "displayName": "MiniMax M2.7 Highspeed"
        },
        {
          "id": "anthropic/claude-opus-4-5",
          "providerModelId": "MiniMax-M2.7",
          "displayName": "MiniMax M2.7 Opus Route"
        }
      ]
    }
  ]
}

Qui ho mappato anche Haiku e Opus, così nel selettore modelli ne hai tre. Utile se vuoi simulare scenari con costi diversi senza cambiare provider.

Z.ai (GLM)

GLM funziona un po’ come Anthropic stessa: oltre alla chiave API serve un GLM Coding Plan attivo (è un abbonamento di pochi dollari al mese). Solo la chiave non basta per usarlo dentro strumenti di sviluppo come Cowork. Una volta attivato il piano, GLM 4.7 è potente sul coding.

{
  "preferences": {
    "coworkScheduledTasksEnabled": true,
    "ccdScheduledTasksEnabled": false,
    "sidebarMode": "task",
    "coworkWebSearchEnabled": true,
    "epitaxyPrefs": {
      "starred-local-code-sessions": []
    }
  },
  "deploymentMode": "3p",
  "providers": [
    {
      "id": "zai-glm",
      "displayName": "Z.ai GLM",
      "type": "custom",
      "apiKey": "LA_TUA_ZAI_API_KEY",
      "baseUrl": "https://api.z.ai/api/anthropic",
      "inferenceModels": [
        {
          "id": "anthropic/claude-sonnet-4-5",
          "providerModelId": "glm-4.7",
          "displayName": "GLM 4.7"
        },
        {
          "id": "anthropic/claude-haiku-4-5",
          "providerModelId": "glm-4.5-air",
          "displayName": "GLM 4.5 Air"
        },
        {
          "id": "anthropic/claude-opus-4-5",
          "providerModelId": "glm-4.7",
          "displayName": "GLM 4.7 Opus Route"
        }
      ]
    }
  ]
}

Ollama Cloud (con il proxy)

Qui la cosa si complica e per questo ho dovuto scrivere un piccolo proxy. Il problema è che Claude Desktop, in modalità 3P, fa una discovery dei modelli chiamando /v1/models. Ollama risponde con i suoi nomi nativi (gemma4:31b-cloudgpt-oss:120b-cloud). Poi Claude però prova a richiamarli usando alias claude-sonnet-4-5-20250929, e Ollama risponde model not found.

Il proxy si mette in mezzo: espone gli alias Anthropic verso Claude e riscrive il nome modello prima di inoltrare la richiesta a Ollama. Una sessantina di righe Node.js, zero dipendenze esterne, MIT license.

Repo: github.com/francescogruner/claude-3p-ollama-proxy

Come funziona

Claude Desktop / Cowork

http://localhost:8787 (proxy)

https://ollama.com/v1/messages

Il mapping di default:

claude-sonnet-4-5-20250929 → gemma4:31b-cloud
claude-haiku-4-5-20251001 → gpt-oss:120b-cloud

Lo puoi cambiare con variabili d’ambiente (MODEL_SONNETMODEL_HAIKUDEFAULT_MODEL).

Installazione

Servono Node.js 18+ e una chiave API di Ollama Cloud.

git clone https://github.com/francescogruner/claude-3p-ollama-proxy.git
cd claude-3p-ollama-proxy

Niente npm install: il proxy usa solo moduli built-in di Node.

Avvio su Windows PowerShell

$env:OLLAMA_API_KEY="LA_TUA_OLLAMA_API_KEY"
node server.js

Avvio su macOS / Linux

export OLLAMA_API_KEY="LA_TUA_OLLAMA_API_KEY"
node server.js

Quando parte, in console leggi:

Proxy attivo su http://localhost:8787
Upstream: https://ollama.com
Modelli esposti a Claude:
[ 'claude-sonnet-4-5-20250929', 'claude-haiku-4-5-20251001' ]
Mapping verso Ollama:
{
'claude-sonnet-4-5-20250929': 'gemma4:31b-cloud',
'claude-haiku-4-5-20251001': 'gpt-oss:120b-cloud'
}
Default: gemma4:31b-cloud

Configurazione lato Claude Desktop

In Sviluppatore → Configura inferenza di terze parti scegli Gateway personalizzato e imposta:

  • Gateway base URLhttp://localhost:8787
  • Gateway API keyollama-proxy (qualsiasi stringa, è solo per superare il check)
  • Auth schemebearer
  • Model list: lascia vuoto

Lasciare la lista vuota è importante: così Claude Desktop chiama /v1/models sul proxy e scopre da solo gli alias.

Health check

Mentre il proxy è in esecuzione, in un altro tab del browser apri:

http://localhost:8787/health

Risposta attesa:

{
"ok": true,
"proxy": "claude-desktop-to-ollama-anthropic-proxy",
"upstream": "https://ollama.com",
"exposedModels": [
"claude-sonnet-4-5-20250929",
"claude-haiku-4-5-20251001"
]
}

Una nota tecnica

Il proxy non converte OpenAI chat completions in formato Anthropic. Si limita a riscrivere il nome del modello e a inoltrare il payload tale e quale. Funziona perché Ollama Cloud espone già /v1/messages Anthropic-compatible. Per provider che parlano solo OpenAI-style servirebbe una traduzione completa, e quella tipicamente rompe i flussi avanzati di Claude (tool_usetool_result, streaming, MCP). Ho preferito tenere il proxy semplice e affidabile per il caso Ollama, che è quello che mi serviva.

Cosa funziona e cosa no in modalità 3P

Funzionano:

  • task a lunga esecuzione
  • accesso al file system locale e cartelle di lavoro
  • connettori MCP locali e remoti
  • skills (vanno reimportate dalla versione standard, l’export funziona)
  • plugins (idem)
  • schedulazione delle attività (l’app deve restare aperta)
  • memoria locale

Non funzionano:

  • la tab Chat
  • la condivisione progetti tra utenti
  • Dispatch
  • mobile app e modalità vocale
  • Claude in Chrome
  • computer use
  • marketplace di skills e plugins

La ricerca web nativa non gira con tutti i provider terze parti (ufficialmente è supportata su Vertex e Azure). Ti basta collegare un MCP server tipo FireCrawl per replicare lo stesso comportamento.

Una nota onesta sulla privacy

Vale la pena dirlo chiaramente: la modalità 3P è nata per non far uscire i tuoi dati dall’infrastruttura che controlli. Ha senso quando “infrastruttura che controlli” significa la tua VPC su AWS, il tuo tenant Vertex AI con regione EU, o un gateway LLM aziendale.

Quando configuri DeepSeek o Minimax come provider, i tuoi prompt finiscono sui server di DeepSeek o Minimax (in Cina). Il vantaggio originale di sovranità del dato decade. Quello che ottieni in cambio è accesso a modelli potenti a una frazione del costo, e la possibilità di usare Cowork senza un abbonamento Anthropic Pro.

Sono due use case completamente diversi. Decidi tu quale è il tuo:

  • Se ti serve governance del dato: paga le API Anthropic ufficiali, oppure usa la modalità 3P con Bedrock, Vertex o Azure.
  • Se vuoi Cowork con modelli economici per progetti personali: i provider terzi vanno benissimo, sapendo che il dato esce dalla tua sfera di controllo.

Io personalmente uso entrambi gli approcci a seconda del progetto. Per cose mie sperimentali Minimax è il mio preferito in questo momento.

Risorse

Cowork 3P è una funzione che evolve di settimana in settimana. Quello che oggi funziona potrebbe non funzionare più tra un po’, oppure potrebbero aprirsi nuovi scenari che oggi sono bloccati. Se quando leggi qualcosa è cambiato, fammelo sapere nei commenti del video o aprimi una issue su GitHub.

Se l’articolo ti è stato utile, iscriviti alla newsletter: ogni venerdì ti mando un riassunto pratico delle novità AI che valgono il tempo di leggere. 

Nuovo su Google

Aggiungi francescogruner.it come fonte preferita

Se leggi spesso i miei articoli su AI, automazione e tecnologia, ora puoi dire a Google che vuoi vedere più spesso i contenuti di francescogruner.it tra le notizie.

Francesco Gruner
Francesco Gruner

Sono un consulente IT, divulgatore e imprenditore tech. Mi occupo di automazione, AI e gestione di sistemi e infrastrutture IT, cercando soluzioni semplici a problemi complessi. Qui condivido strumenti, esperimenti e idee utili.