AI Index 2026 di Stanford: progressi e crisi di fiducia

Pubblicato questa primavera dall'istituto Stanford HAI, l'AI Index 2026 è la radiografia più completa dello stato dell'intelligenza artificiale: centinaia di dati su prestazioni, economia, adozione e percezione pubblica. La fotografia che ne esce è a doppia faccia. Da un lato progressi tecnici impressionanti; dall'altro un pubblico sempre più diffidente e modelli che restano stranamente fallibili su compiti banali. Vale la pena leggere i numeri con attenzione, perché raccontano più di mille annunci.

Le prestazioni: da SWE-bench all'oro alle Olimpiadi di matematica

Sui benchmark il balzo è netto. Sul test di programmazione SWE-bench Verified, le prestazioni dei modelli migliori sono passate da circa il 60% a quasi il 100% in un solo anno. I sistemi superano gli esseri umani di riferimento su domande scientifiche di livello dottorale e sulla matematica da competizione, e un modello di Google ha conquistato una medaglia d'oro alle Olimpiadi Internazionali di Matematica. È la conferma che, nei domini ben definiti e misurabili, la frontiera si sposta a una velocità che pochi avevano previsto.

Il paradosso del "jagged frontier"

C'è però un rovescio della medaglia, che il rapporto chiama jagged frontier, la "frontiera frastagliata". Lo stesso modello capace di risolvere problemi da olimpiade può sbagliare compiti elementari: secondo l'Index, i sistemi di punta leggono correttamente un orologio analogico solo nel 50,1% dei casi. È un promemoria fondamentale: le capacità dell'IA non crescono in modo uniforme. Eccellenza e fragilità convivono, e questo rende rischioso dedurre da una prodezza che il modello "capisce" tutto.

I benchmark migliorano a ritmi record, ma le capacità restano irregolari.

Produttività: i guadagni reali misurati sul campo

Sul versante economico, l'Index raccoglie studi che misurano l'impatto reale dell'IA sul lavoro. I guadagni di produttività vanno dal 14-15% nel supporto clienti a circa il 26% nello sviluppo software, con punte ancora più alte in alcune attività di marketing. Sono numeri significativi, ma con un'avvertenza: i benefici maggiori tendono a concentrarsi sui lavoratori meno esperti, che colmano il divario con i colleghi più bravi, mentre l'adozione di veri agenti autonomi resta ancora limitata nella maggior parte dei reparti.

Il divario di fiducia tra esperti e cittadini

Il dato forse più politico riguarda la percezione. Tra gli esperti statunitensi, il 73% giudica positivo l'impatto dell'IA sul mercato del lavoro; tra i cittadini comuni, la quota crolla al 23%. È un divario enorme, che segnala quanto il dibattito pubblico sia distante da quello degli addetti ai lavori. A questo si aggiunge una bassa fiducia nella capacità delle istituzioni di regolare la tecnologia, con gli Stati Uniti in fondo alla classifica e l'Unione Europea relativamente più credita su questo fronte.

Come leggere questi dati senza farsi ingannare

Sul fronte degli investimenti e della geografia, l'Index conferma il testa a testa tra Stati Uniti e Cina: gli USA restano davanti per capitali privati mobilitati, mentre la Cina domina per volume di pubblicazioni, brevetti e robotica industriale. Il divario di prestazioni tra i migliori modelli dei due Paesi, che fino a poco tempo fa era netto, si è ridotto quasi a zero. È un dato che pesa sul dibattito europeo, dove cresce la consapevolezza di essere rimasti indietro su scala e infrastrutture.

Come leggere questi dati senza farsi ingannare

L'AI Index è prezioso proprio perché invita alla prudenza. I benchmark spettacolari vanno bilanciati con il jagged frontier; i guadagni di produttività con la loro distribuzione disomogenea; gli annunci dei laboratori con la diffidenza dei cittadini. Per AI Notizie, che applica linee guida editoriali basate sulla verifica delle fonti, il rapporto è anche un metro: quando un'azienda annuncia un risultato "sovrumano", la domanda giusta non è "quanto è alto il punteggio", ma "su quale compito, misurato come, e con quali limiti". È così che si distingue il progresso reale dal rumore di fondo. Vale la pena ricordare che l'AI Index è un lavoro accademico annuale, non un comunicato di settore: i suoi dati vengono raccolti e verificati da ricercatori indipendenti, ed è questa la ragione per cui resta il punto di riferimento più citato quando si vuole misurare, numeri alla mano, dove sta andando davvero l'intelligenza artificiale.