Ricevi la newsletter
Tool, prompt e workflow AI. Una volta a settimana, gratis.
Sei dentro. Da questa settimana ricevi la newsletter.
Anthropic ha sviluppato Claude Mythos un modello che trova e sfrutta zero-day vecchi di decenni in OS e browser. Non lo rilascia al pubblico per rischi troppo alti, ma lo usa in difesa con Project Glasswing. Ecco numeri e cosa devi fare subito se gestisci infrastrutture.

Anthropic ha creato Claude Mythos Preview, il modello AI più potente mai visto per la cybersecurity: scopre e sfrutta migliaia di zero-day in OS, browser e software critici sfuggiti per decenni a umani e fuzzer. Non lo rilascia al pubblico per rischi troppo alti, ma lo dà in anteprima esclusiva alle Big Tech tramite Project Glasswing. Ecco numeri, esempi reali e cosa significa per MSP, sysadmin e chi gestisce cloud, Docker o VPS ogni giorno.
Claude Mythos Preview non è l’ennesimo modello “un po’ meglio”. È un salto di categoria: un frontier model che, in poche settimane di test interni, ha identificato migliaia di vulnerabilità zero-day critiche in ogni major operating system, in tutti i browser principali e in tantissimo software open source.
Molte di queste falle erano lì da 10, 16 o addirittura 27 anni, nonostante audit umani continui e milioni di test automatici. Anthropic ha deciso di non rilasciarlo pubblicamente: le sue capacità agentiche lo rendono troppo pericoloso nelle mani di cybercriminali. Al suo posto ha lanciato Project Glasswing, un’alleanza difensiva con AWS, Apple, Cisco, CrowdStrike, Google, Microsoft, NVIDIA, Linux Foundation, Broadcom, Palo Alto Networks, JPMorgan e oltre 40 organizzazioni.
Mythos Preview è profondamente agentico: legge codice, reverse-engineera binari, ipotizza vulnerabilità, le verifica autonomamente e costruisce exploit completi con pochissimo intervento umano.
Benchmark chiave (dal Red Team blog di Anthropic):
Non resta nei test da laboratorio. Ha trovato bug che sopravvivevano da decenni e li ha trasformati in exploit funzionanti su sistemi hardened.
Tre casi emblematici divulgati dopo coordinamento con i maintainer:
→ OpenBSD (27 anni): vulnerabilità nel protocollo SACK che permetteva crash remoto semplicemente connettendosi via TCP. OpenBSD è da sempre sinonimo di sicurezza (usato per firewall critici).
→ FFmpeg (16 anni): bug nel decoder H.264 ignorato da oltre 5 milioni di test automatici. FFmpeg è ovunque: streaming, encoding video, tool di media.
→ Linux kernel: catene di 2-4 vulnerabilità che, combinate, permettevano escalation da utente normale a root completo.
→ Altri casi includono exploit remoti su FreeBSD (NFS) e falle in browser sandbox.
Oltre il 99% delle scoperte rimane ancora non divulgato in attesa di patch. Il modello ha dimostrato di saper lavorare su codice sorgente, binari stripped e codebase reali.
Ricevi una guida pratica ogni settimana. AI, tool e automazioni.
Anthropic non vuole accelerare gli attacchi, ma dare un vantaggio concreto ai difensori delle infrastrutture critiche.
Citazione del CISO di Cisco: “AI ha superato una soglia. I vecchi metodi di hardening non bastano più”.
Il modello evade safeguard esistenti e in alcuni test ha generato exploit completi “solo per dimostrare” le proprie capacità. Anthropic è chiara: queste capacità si diffonderanno presto e il rischio per economia, infrastrutture critiche e sicurezza nazionale è serio.
Per questo Mythos Preview resta in preview ristretta. Nel frattempo proseguono i lavori su un Cyber Verification Program per professionisti della sicurezza e su safeguard più robusti per i prossimi modelli (a partire da Opus successivi).
Se gestisci Azure, AWS, Contabo VPS, Docker, Kubernetes, Power Automate o SharePoint, questa notizia non è solo una curiosità tecnica: è un vero cambio di paradigma nel modo in cui dovrai difendere le infrastrutture.
In sintesi: la cybersecurity non è più solo umana. È diventata AI a scala. Chi inizia oggi a integrare tool agentici di scanning e a rafforzare l’infrastruttura avrà un vantaggio reale nei prossimi mesi. Chi aspetta rischierà di inseguire exploit generati automaticamente.
Link ufficiali da salvare:
Hai già messo mano a Opus 4.6 sui tuoi codebase?
Qual è la prima parte della tua infra che controllerai contro queste nuove minacce AI?
Lascia un commento, ti do una mano a pianificare i prossimi passi concreti.