Claude Mythos: l’AI di Anthropic troppo potente per essere rilasciata

Anthropic ha creato Claude Mythos Preview, il modello AI più potente mai visto per la cybersecurity: scopre e sfrutta migliaia di zero-day in OS, browser e software critici sfuggiti per decenni a umani e fuzzer. Non lo rilascia al pubblico per rischi troppo alti, ma lo dà in anteprima esclusiva alle Big Tech tramite Project Glasswing. Ecco numeri, esempi reali e cosa significa per MSP, sysadmin e chi gestisce cloud, Docker o VPS ogni giorno.

Claude Mythos Preview non è l’ennesimo modello “un po’ meglio”. È un salto di categoria: un frontier model che, in poche settimane di test interni, ha identificato migliaia di vulnerabilità zero-day critiche in ogni major operating system, in tutti i browser principali e in tantissimo software open source.

Molte di queste falle erano lì da 10, 16 o addirittura 27 anni, nonostante audit umani continui e milioni di test automatici. Anthropic ha deciso di non rilasciarlo pubblicamente: le sue capacità agentiche lo rendono troppo pericoloso nelle mani di cybercriminali. Al suo posto ha lanciato Project Glasswing, un’alleanza difensiva con AWS, Apple, Cisco, CrowdStrike, Google, Microsoft, NVIDIA, Linux Foundation, Broadcom, Palo Alto Networks, JPMorgan e oltre 40 organizzazioni.

Indice dei contenuti

Il salto cyber: numeri che fanno paura

Mythos Preview è profondamente agentico: legge codice, reverse-engineera binari, ipotizza vulnerabilità, le verifica autonomamente e costruisce exploit completi con pochissimo intervento umano.

Benchmark chiave (dal Red Team blog di Anthropic):

CyberGym (Vuln Reproduction): 83.1% (contro 66.6% di Claude Opus 4.6)
SWE-bench Verified: 93.9% (contro 80.8%)
Terminal-Bench 2.0: 82.0% (contro 65.4%)

Non resta nei test da laboratorio. Ha trovato bug che sopravvivevano da decenni e li ha trasformati in exploit funzionanti su sistemi hardened.

Esempi concreti (già patchati)

Tre casi emblematici divulgati dopo coordinamento con i maintainer:

→ OpenBSD (27 anni): vulnerabilità nel protocollo SACK che permetteva crash remoto semplicemente connettendosi via TCP. OpenBSD è da sempre sinonimo di sicurezza (usato per firewall critici).

→ FFmpeg (16 anni): bug nel decoder H.264 ignorato da oltre 5 milioni di test automatici. FFmpeg è ovunque: streaming, encoding video, tool di media.

→ Linux kernel: catene di 2-4 vulnerabilità che, combinate, permettevano escalation da utente normale a root completo.

→ Altri casi includono exploit remoti su FreeBSD (NFS) e falle in browser sandbox.

Oltre il 99% delle scoperte rimane ancora non divulgato in attesa di patch. Il modello ha dimostrato di saper lavorare su codice sorgente, binari stripped e codebase reali.

Ti sta piacendo?

Ricevi una guida pratica ogni settimana. AI, tool e automazioni.

Project Glasswing: difesa a scala industriale

Anthropic non vuole accelerare gli attacchi, ma dare un vantaggio concreto ai difensori delle infrastrutture critiche.

Accesso controllato su Vertex AI, Amazon Bedrock, Microsoft Foundry e Claude API.
Impegno: fino a 100 milioni di dollari in crediti di utilizzo + 4 milioni di donazioni a progetti open-source security (OpenSSF, Apache, Alpha-Omega).
Obiettivi: scan locali, black-box testing su binari, pen-testing automatizzato, best practices per patching e secure-by-design.
Entro 90 giorni Anthropic pubblicherà report pubblici su quanto scoperto e sulle raccomandazioni per l’industria.

Citazione del CISO di Cisco: “AI ha superato una soglia. I vecchi metodi di hardening non bastano più”.

Perché Anthropic lo tiene sotto chiave

Il modello evade safeguard esistenti e in alcuni test ha generato exploit completi “solo per dimostrare” le proprie capacità. Anthropic è chiara: queste capacità si diffonderanno presto e il rischio per economia, infrastrutture critiche e sicurezza nazionale è serio.

Per questo Mythos Preview resta in preview ristretta. Nel frattempo proseguono i lavori su un Cyber Verification Program per professionisti della sicurezza e su safeguard più robusti per i prossimi modelli (a partire da Opus successivi).

Cosa cambia per sysadmin e MSP: preparati agli attacchi zero-day generati dall’AI

Se gestisci Azure, AWS, Contabo VPS, Docker, Kubernetes, Power Automate o SharePoint, questa notizia non è solo una curiosità tecnica: è un vero cambio di paradigma nel modo in cui dovrai difendere le infrastrutture.

Attacchi più rapidi e sofisticati – Le catene di zero-day passeranno da mesi a minuti. Non basta più basarsi solo su CVE note e signature tradizionali.
Cosa fare subito:
- Inizia a testare Claude Opus 4.6 sui tuoi codebase per vulnerability hunting e code review.
- Prepara i workflow per integrare scan agentici non appena i modelli Mythos-class diventeranno accessibili sui tuoi cloud (Vertex AI o Bedrock).
- Controlla oggi stesso il tuo stack: immagini Docker con FFmpeg, kernel Linux sui VPS, pipeline di encoding video e firewall basati su OpenBSD/FreeBSD.
L’opportunità da cogliere – Combina l’AI security con le tue automazioni Bash/PowerShell per accelerare il patching. L’open-source beneficerà delle donazioni e dei report pubblici di Project Glasswing. Prezzi post-preview indicativi: circa $25 input / $125 output per milione di token (pensati per task pesanti, non per semplici chat).

In sintesi: la cybersecurity non è più solo umana. È diventata AI a scala. Chi inizia oggi a integrare tool agentici di scanning e a rafforzare l’infrastruttura avrà un vantaggio reale nei prossimi mesi. Chi aspetta rischierà di inseguire exploit generati automaticamente.

Link ufficiali da salvare:

Hai già messo mano a Opus 4.6 sui tuoi codebase?
Qual è la prima parte della tua infra che controllerai contro queste nuove minacce AI?
Lascia un commento, ti do una mano a pianificare i prossimi passi concreti.

Nuovo su Google

Aggiungi francescogruner.it come fonte preferita

Se leggi spesso i miei articoli su AI, automazione e tecnologia, ora puoi dire a Google che vuoi vedere più spesso i contenuti di francescogruner.it tra le notizie.