OpenAI Daybreak: GPT-5.5-Cyber e Patch the Planet

Il 22 giugno 2026 OpenAI ha aperto a tutti i suoi clienti aziendali GPT-5.5-Cyber, il modello che l'azienda definisce «il piu' capace mai realizzato per trovare e aiutare a correggere le vulnerabilita' del software», e ha ampliato il programma di sicurezza Daybreak con una nuova iniziativa open source chiamata Patch the Planet. L'annuncio sposta l'attenzione del settore: dopo mesi in cui si e' discusso soprattutto del rischio che l'IA aiuti gli attaccanti, OpenAI prova a dimostrare che gli stessi modelli possono stare, in modo decisivo, dalla parte dei difensori.

Cosa fa GPT-5.5-Cyber e quanto e' migliorato

GPT-5.5-Cyber e' una versione specializzata di GPT-5.5 ottimizzata per la sicurezza informatica. Il flusso di lavoro che OpenAI descrive e' completo: il modello analizza basi di codice molto estese, individua i bug, li verifica in un ambiente isolato per capire se sono davvero sfruttabili, e infine scrive e collauda la correzione. Non si limita quindi a segnalare un sospetto, ma prova a chiudere il cerchio fino alla patch.

Secondo i dati diffusi dall'azienda, il salto rispetto al modello generalista e' netto. Sul benchmark CyberGym passa dall'81,8% di GPT-5.5 all'85,6%; su ExploitGym, che misura la capacita' di costruire exploit funzionanti, sale dal 25,95% al 39,5%; su SEC-bench Pro dal 63,1% al 69,8%. Sono numeri di laboratorio che, da soli, direbbero poco. Ma OpenAI li accompagna con un elenco di vulnerabilita' reali gia' scoperte usando Daybreak, ed e' qui che la storia diventa concreta.

L'idea di Daybreak: usare un modello specializzato per trovare e correggere i bug prima degli attaccanti.

I bug scoperti: dal kernel Linux a OpenBSD vecchio di 23 anni

Daybreak ha gia' fatto emergere falle in sistemi operativi e browser molto diffusi. Nel kernel Linux il modello ha prodotto 8 dimostrazioni di fuga di puntatori (information leak) e 24 exploit di escalation locale dei privilegi, cioe' tecniche che consentono a un utente normale di ottenere i poteri di amministratore. In FreeBSD ha trovato 34 vulnerabilita' e 7 prove di escalation. In OpenBSD — un sistema operativo noto proprio per l'attenzione maniacale alla sicurezza — ha individuato un use-after-free rimasto nascosto per 23 anni nell'implementazione dei semafori System V.

A questi si aggiungono 6 falle in dnsmasq (con i codici CVE-2026-4890, 4891, 4892 e 5172), il componente che gestisce DNS e DHCP in moltissimi router domestici, una serie di vulnerabilita' nei motori JavaScript di Chrome (V8) e Safari, una in Firefox legata a WebAssembly, e un attacco di tipo «HTTP/2 bomb» capace di mandare in denial of service server come NGINX, Apache e IIS. La varieta' dei bersagli e' il messaggio: non un caso fortunato, ma una capacita' applicabile a software molto diversi.

Patch the Planet, Codex Security e il programma per i partner

L'altra novita' e' Patch the Planet, un'iniziativa nata in collaborazione con la societa' di sicurezza Trail of Bits per mettere in sicurezza i progetti open source da cui dipende mezza Internet. Tra i primi partecipanti ci sono nomi pesanti: cURL, NATS, la libreria crittografica pyca/cryptography, Sigstore, aiohttp, il linguaggio Go, freenginx e Python (con python.org). L'obiettivo dichiarato e' usare GPT-5.5-Cyber per scovare e correggere bug in software che spesso nessuno paga per mantenere ma che tutti usano: una delle vulnerabilita' piu' note degli ultimi anni, Heartbleed, nasceva proprio da una libreria open source sottofinanziata.

In parallelo, OpenAI ha aggiornato il plugin Codex Security — che accelera scansioni, triage delle segnalazioni dei bug bounty, modellazione delle minacce e generazione delle patch — e ha lanciato il Daybreak Cyber Partner Program per le aziende di cybersicurezza che vogliono integrare il modello nei propri prodotti difensivi. L'accesso, sottolinea l'azienda, resta riservato a «difensori fidati»: una scelta pensata per evitare che lo stesso strumento finisca in mano a chi attacca.

Patch the Planet punta a correggere bug nei progetti open source che reggono buona parte di Internet.

Perche' conta per chi gestisce sistemi

Il punto piu' interessante non e' il singolo benchmark, ma il modello operativo. Finora gli strumenti automatici di analisi producevano montagne di segnalazioni, lasciando agli esperti il lavoro lento di capire quali fossero reali e come risolverle. Un modello che verifica la vulnerabilita' in un ambiente isolato e propone gia' una patch testata cambia l'economia del lavoro: riduce i falsi positivi e accorcia i tempi tra scoperta e correzione, la finestra in cui un sistema resta esposto. Per un'azienda che gestisce migliaia di server, comprimere quella finestra da settimane a ore puo' fare la differenza tra un incidente evitato e una violazione.

Restano le incognite. OpenAI non ha comunicato un prezzo per GPT-5.5-Cyber, e la disponibilita' «a difensori fidati» lascia aperta la domanda su chi decida cosa sia fidato. C'e' poi il rovescio della medaglia, ben noto agli esperti: un modello bravo a costruire exploit e' utile in difesa quanto pericoloso in attacco, e il confine tra le due cose e' sottile. La scommessa di OpenAI e' che mettere questi strumenti, in modo controllato, dalla parte di chi protegge i sistemi sposti l'equilibrio a favore della difesa, dove spesso manca il tempo e il personale che invece gli attaccanti hanno. I prossimi mesi, e il numero di patch che Patch the Planet riuscira' davvero a far entrare nei progetti, diranno se la scommessa regge.

Questo articolo si basa sul comunicato ufficiale di OpenAI e su verifiche incrociate con fonti di settore.