Project Glasswing: l'IA di Anthropic scova falle critiche

Il 2 giugno 2026 Anthropic ha annunciato l'estensione di Project Glasswing, l'iniziativa con cui usa l'intelligenza artificiale per trovare e correggere vulnerabilità nel software che fa funzionare le infrastrutture critiche. Il programma, lanciato ad aprile con una cinquantina di partner, si allarga a circa 150 nuove organizzazioni in oltre 15 Paesi, arrivando a un totale di circa 200 partecipanti.

Quali settori entrano e con quale obiettivo

La novità non è solo numerica. I nuovi partecipanti coprono settori che nella prima fase erano poco rappresentati: energia elettrica, acqua, sanità, telecomunicazioni e produzione hardware. Si tratta in molti casi di fornitori il cui codice gira dentro sistemi usati da governi e da milioni di organizzazioni. Secondo Anthropic, per la maggior parte di questi partner «un attacco grave potrebbe colpire più di 100 milioni di persone»: di qui la scelta di dare loro accesso prioritario a strumenti di difesa avanzati.

Tra le realtà che secondo le ricostruzioni della stampa hanno ottenuto l'accesso figurano nomi pesanti: la società di gestione delle identità Okta, i gruppi sudcoreani Samsung, SK Hynix e SK Telecom, l'Alleanza Atlantica (NATO) e l'ENISA, l'agenzia dell'Unione Europea per la cybersicurezza.

Claude Mythos analizza il codice alla ricerca di falle sfruttabili.

Che cos'è Claude Mythos e cosa ha trovato finora

Al centro del programma c'è Claude Mythos Preview, un modello di frontiera non ancora rilasciato pubblicamente e specializzato in compiti di sicurezza informatica. La tesi di Anthropic è netta e per certi versi inquietante: i modelli hanno raggiunto un livello di capacità nella programmazione tale da superare quasi tutti gli esseri umani — tranne i più abili — nel trovare e sfruttare vulnerabilità software.

I numeri dichiarati danno la misura del fenomeno: dal lancio di aprile, i partecipanti a Glasswing avrebbero individuato con Claude Mythos oltre 10.000 falle di gravità alta o critica. Sono difetti che, in mani ostili, potrebbero tradursi in intrusioni, blocchi di servizi essenziali o furti di dati su larga scala.

Come funziona in pratica e perché serve la divulgazione responsabile

Il meccanismo ricalca quello della ricerca di sicurezza tradizionale, ma a una velocità diversa. Il modello analizza il codice sorgente o i binari dei sistemi dei partner, segnala i punti deboli e propone le correzioni; i team umani verificano, danno priorità e applicano le patch. La differenza è la scala: un modello può passare al setaccio quantità di codice che richiederebbero a un team di esperti mesi o anni. Proprio per questo Anthropic insiste sulla divulgazione responsabile, cioè sulla regola di comunicare le falle prima ai produttori del software, dando loro il tempo di correggerle prima che diventino pubbliche e quindi sfruttabili.

Il dilemma della doppia faccia dell'IA

Project Glasswing illustra in modo plastico la natura a doppio uso di queste tecnologie. Lo stesso modello che aiuta i difensori a tappare i buchi prima degli attaccanti potrebbe, in versioni meno controllate, diventare uno strumento offensivo formidabile. Non a caso Anthropic accompagna l'annuncio con un avvertimento: entro 6-12 mesi, sostiene, altre aziende svilupperanno capacità analoghe, e non è detto che lo facciano con le stesse cautele.

È un messaggio che ha un destinatario implicito anche nei regolatori. In Europa, dove l'AI Act e le norme sulla cybersicurezza delle infrastrutture critiche stanno entrando a regime, la dimostrazione che un modello può trovare migliaia di vulnerabilità reali alza la posta: la difesa va automatizzata e accelerata, perché lo stesso può fare chi attacca. Per ora Glasswing è un programma a inviti e Claude Mythos resta non disponibile al pubblico. Ma è una delle prove più concrete, finora, di che cosa significhi mettere l'IA al servizio — e potenzialmente contro — la sicurezza dei sistemi da cui dipende la vita di tutti i giorni.