Stanford HAI ha pubblicato a fine aprile la nona edizione dell'Artificial Intelligence Index Report, il dossier piu' citato al mondo per misurare lo stato del settore. La fotografia del 2025 racconta una corsa che brucia capitali, batte i benchmark e moltiplica gli incidenti, ma fatica a essere trasparente.

Gli investimenti corporate globali in IA sono raddoppiati in dodici mesi e hanno raggiunto i 581 miliardi di dollari, contro i 253 dell'anno precedente. Di questi, 344 miliardi sono usciti dal solo mercato statunitense: oltre 23 volte i 12,4 miliardi cinesi. Ma il gap di prestazione fra i modelli americani e quelli cinesi, ricorda Stanford, si e' assottigliato fino a chiudersi su molti benchmark di laboratorio, in particolare quelli di ragionamento e matematica.

Cinquanta modelli notevoli, quasi tutti industriali

Nel 2025 sono usciti dagli Stati Uniti 50 "notable models", ovvero modelli rilasciati pubblicamente e citati dalla comunita' scientifica. Una quota mai vista. La novita' e' un'altra: praticamente nessuno e' di matrice accademica. "Le universita' producono ancora paper, ma i modelli li costruiscono le aziende", scrivono i ricercatori dell'HAI. Anche perche' addestrarli costa: la stima del costo di addestramento di Grok 4 di xAI varia fra 70 e 140 milioni di dollari, contro i 5,2 milioni di GPT-4 nel 2023.

Humanity's Last Exam: la barriera infranta

Il benchmark di riferimento dell'anno e' Humanity's Last Exam, una raccolta di problemi a livello dottorale scritti da esperti in oltre 200 discipline. A inizio 2025, i migliori modelli ottenevano l'8,8 per cento; ad aprile 2026 Claude Opus 4.6 di Anthropic e Gemini 3.1 Pro di Google superano entrambi il 50 per cento. Su SWE-bench Verified, il benchmark di ingegneria del software, gli agenti di frontiera sono passati dal 60 per cento al quasi 100 per cento in dodici mesi.

Restano pero' i "buchi" imbarazzanti. GPT-5.4 di OpenAI legge correttamente un orologio analogico solo nel 50,6 per cento dei casi; Claude Opus 4.6 si ferma all'8,9 per cento. Per quanto i grandi modelli sappiano dimostrare teoremi, faticano ancora sui compiti percettivi banali.

Quasi tutti i 50 modelli notevoli del 2025 sono usciti da aziende, non da universita'

Adozione di massa: l'88% delle organizzazioni

L'adozione organizzativa dell'IA generativa ha raggiunto l'88 per cento, contro il 78 del 2024. Quattro studenti universitari su cinque dichiarano di usare regolarmente strumenti generativi. La diffusione fra la popolazione generale e' arrivata al 53 per cento in soli tre anni, piu' veloce dell'arrivo del personal computer e dello stesso internet. Il valore economico generato dall'IA generativa per i consumatori americani e' stimato in 172 miliardi di dollari l'anno, con un valore mediano per utente triplicato fra il 2025 e il 2026.

Trasparenza in caduta libera

Il rovescio della medaglia e' la trasparenza. Il Foundation Model Transparency Index e' sceso a 40 punti, dai 58 dell'anno scorso. I grandi laboratori (OpenAI, Anthropic, Google, xAI, Meta) hanno smesso di pubblicare dataset, dimensioni dei modelli e in molti casi anche i conteggi di parametri. Gli incidenti documentati sono saliti da 233 a 362: deepfake, allucinazioni gravi, bias discriminatori, exploit di sicurezza. Stanford li classifica per categoria e li mappa per Paese di origine, dando un'idea della pressione regolamentare in arrivo.

Energia e ambiente, il prezzo nascosto

Stanford torna anche sull'impronta ambientale. L'addestramento di Grok 4 ha generato fra 72.000 e 140.000 tonnellate di CO2 equivalente, da confrontarsi con le 5.184 di GPT-4. Quello di Llama 5, secondo la stima dell'AI Index, e' stato il piu' emissivo di sempre. I gestori dei data center stanno spostandosi su contratti diretti con centrali nucleari (SMR) e geotermiche per evitare il blowback PR, ma gli auditor indipendenti restano scettici.

L'opinione pubblica e la sfiducia nei regolatori

Sul fronte umano, la fotografia globale e' di un cauto ottimismo: il 59 per cento delle persone intervistate ritiene che i benefici dell'IA supereranno gli svantaggi, contro il 52 del 2025. Ma solo il 31 per cento degli statunitensi si fida del proprio governo a regolare la tecnologia, il dato piu' basso fra tutti i Paesi sondati. Il 33 per cento degli americani crede che l'IA migliorera' il proprio lavoro, contro una media globale del 40.

Cosa dice ai legislatori europei

Per Bruxelles l'AI Index e' una miniera di argomenti. La caduta della trasparenza giustifica l'inasprimento previsto dal nuovo accordo "omnibus" sull'AI Act del 7 maggio, che impone watermark obbligatori sui contenuti sintetici dal 2 dicembre 2026 e amplia gli obblighi sui modelli ad alto impatto sistemico. L'aumento degli incidenti documentati supporta la richiesta del Garante italiano per la privacy di poteri di blocco sulle piattaforme, mentre il record dei consumi energetici alimenta il dibattito sulla compatibilita' fra IA e Green Deal. Stanford avverte: senza standard comuni di rendicontazione, ogni stima resta a piacere di chi la pubblica.