Uno dei laboratori che ha più contribuito alla corsa all'intelligenza artificiale ha pubblicato un documento che, in sostanza, suggerisce di togliere il piede dall'acceleratore. Il 4 giugno 2026 Anthropic ha diffuso un saggio intitolato When AI builds itself in cui sostiene che, se fosse possibile rallentare in modo verificabile lo sviluppo dei modelli più potenti, sarebbe probabilmente "una buona cosa". A firmarlo sono Marina Favaro, responsabile della ricerca interna, e Jack Clark, capo delle politiche pubbliche dell'azienda.

La tesi non è il solito allarme generico. Anthropic parla di un fenomeno preciso: l'auto-miglioramento ricorsivo, cioè il punto in cui un sistema diventa capace di progettare e sviluppare in modo autonomo il proprio successore. "Non ci siamo ancora", scrivono gli autori, ma il momento potrebbe arrivare "prima di quanto la maggior parte delle istituzioni sia preparata ad affrontare".

I numeri che Anthropic mette sul tavolo

A rendere l'argomento concreto sono alcuni dati interni che l'azienda ha deciso di rendere pubblici. Secondo il documento, a maggio 2026 oltre l'80% del codice integrato nei sistemi di produzione di Anthropic è stato scritto da Claude, il suo assistente. Gli ingegneri dell'azienda dichiarano di rilasciare otto volte più codice a trimestre rispetto alla media del periodo 2021-2025.

C'è poi il dato sulla velocità con cui crescono le capacità. Anthropic afferma che il tempo di un compito che i suoi modelli riescono a portare a termine in modo affidabile è raddoppiato all'incirca ogni quattro mesi: si è passati da attività da quattro minuti a marzo 2024 a compiti che richiedono fino a dodici ore di lavoro un anno dopo. In un test di ricerca aperta sulla sicurezza dell'IA, una versione sperimentale chiamata Claude Mythos avrebbe recuperato il 97% del divario di prestazioni rispetto al risultato atteso, contro il 23% ottenuto da due ricercatori umani.

Secondo Anthropic, oltre l'80% del codice di produzione è già scritto da Claude.

Perché una pausa decisa da soli non serve a nulla

Il punto più interessante è che Anthropic non chiede di fermarsi unilateralmente. Un laboratorio che si ferma da solo, ammettono gli autori, lascerebbe semplicemente campo libero ai concorrenti meno prudenti. La proposta è diversa: costruire sistemi di verifica che permettano a un laboratorio di confermare che gli altri si sono davvero fermati, rendendo possibile un coordinamento internazionale credibile.

L'azienda paragona il problema al controllo degli armamenti nucleari, ma avverte che qui la sfida è più ardua: addestrare un modello è molto più facile da nascondere di un silo missilistico, e la tentazione di proseguire di nascosto sarebbe enorme. Per questo Anthropic suggerisce di avviare fin da ora conversazioni con governi, ricercatori e società civile, e di sviluppare meccanismi capaci di individuare eventuali "defezioni" da un rallentamento concordato.

Cosa cambia per chi sviluppa software e per i governi

Per chi lavora nel settore, il messaggio implicito è che la produttività portata dall'IA non è un'astrazione di marketing: se davvero "cinquanta ingegneri fanno ciò che cinque anni fa richiedeva cinquecento persone", come ripetono diversi investitori della Silicon Valley, allora i modelli che scrivono codice stanno già accorciando i tempi di sviluppo dei modelli successivi. È esattamente l'anello che preoccupa Anthropic.

Sul piano politico, la presa di posizione arriva in un momento delicato. Anthropic ha da poco raggiunto una valutazione vicina ai 1.000 miliardi di dollari e ha depositato i documenti per la quotazione in borsa: chiedere regole più stringenti mentre si corre verso l'IPO è una scelta che i critici leggono come ambigua e i sostenitori come coerente con la missione dichiarata dell'azienda. In Europa, dove il quadro dell'AI Act già prevede obblighi per i modelli con rischio sistemico, il documento offre argomenti a chi spinge per un controllo più severo sui sistemi di frontiera.

Resta la domanda di fondo, che Anthropic stessa non scioglie: un coordinamento globale che includa Stati Uniti e Cina, con regole verificabili da tutti, è realistico nel clima attuale? Per ora la risposta è no. Ma il fatto che a porre la questione sia uno dei protagonisti della corsa, e non un gruppo di accademici esterni, rende il dibattito difficile da ignorare.

I dubbi sollevati dalla comunità scientifica

Il documento ha diviso esperti e addetti ai lavori. Una parte della comunità ha apprezzato la trasparenza dei dati interni e la volontà di spostare la discussione dal terreno fantascientifico a quello dei meccanismi concreti di verifica. Altri, più scettici, leggono nella mossa una forma di marketing della paura: enfatizzare quanto siano potenti i propri modelli sarebbe anche un modo per alimentarne il valore percepito, proprio mentre l'azienda corre verso la quotazione. C'è infine chi osserva che parlare di "auto-miglioramento ricorsivo" rischia di distogliere l'attenzione dai problemi già concreti dell'IA — disinformazione, bias, impatto sul lavoro — spostandola su scenari ipotetici.

Va ricordato che testate e ricercatori hanno verificato la pubblicazione e i dati citati nel saggio di Anthropic; le valutazioni e i confronti proposti in questo articolo sono invece nostri. Quel che è certo è che il tema della governance dei modelli di frontiera, fino a poco tempo fa confinato ai convegni di settore, è ormai entrato nell'agenda dei governi: tra obblighi dell'AI Act in Europa e ordini esecutivi negli Stati Uniti, la richiesta di un "freno coordinato" da parte di un laboratorio leader peserà inevitabilmente sulle prossime discussioni regolatorie.