Oltre le GPU: Il Giappone e la vera sovranità AI

Il Giappone, con il suo programma nazionale GENIAC, sta dimostrando che la vera sfida per la sovranità nell'intelligenza artificiale va ben oltre il semplice possesso di GPU potenti.

Oltre le GPU: Il Giappone ci insegna la vera sovranità AI

Mentre il mondo rincorre le GPU come fossero l'unica chiave per l'intelligenza artificiale, il Giappone, con il suo programma nazionale GENIAC (Generative AI Accelerator Challenge), ci mostra una strada diversa. Non basta ammassare chip potentissimi, la vera sfida è costruire un ecosistema robusto e indipendente. Il Ministero dell'Economia, del Commercio e dell'Industria (METI) giapponese, in collaborazione con AWS, sta dimostrando che la sovranità tecnologica si conquista con una strategia a tutto tondo, non solo con la potenza di calcolo bruta.

Il cuore di questa iniziativa è un partenariato che fornisce a 12 organizzazioni giapponesi non solo l'infrastruttura necessaria, ma anche un supporto tecnico e strategico fondamentale per sviluppare i propri modelli fondazionali (FM). È una lezione preziosa, come evidenziato in un recente articolo sul blog di AWS, che va 'oltre gli acceleratori' e ci svela cosa serve davvero per vincere la corsa all'AI.

Non solo hardware: la guida tecnica fa la differenza

L'esperienza del programma GENIAC ha messo in luce un aspetto cruciale: l'accesso a migliaia di GPU è solo il punto di partenza. Il successo nella creazione di modelli fondazionali su larga scala dipende in gran parte da una guida tecnica esperta. Non si tratta solo di accendere le macchine, ma di saperle configurare e ottimizzare per ottenere il massimo delle performance riducendo i costi. AWS ha scoperto che assegnare oltre 1.000 acceleratori era solo l'inizio; la vera sfida risiedeva nell'architettare un sistema affidabile e superare gli ostacoli della formazione distribuita. Questo ha richiesto la creazione di team interfunzionali, che includevano account team, Solutions Architect specialisti e team di servizio, uniti per fornire un supporto coordinato e specifico. Un approccio che ha permesso di affrontare problematiche complesse, come la gestione di dati su larga scala e l'ottimizzazione delle librerie di comunicazione tra GPU, come la NCCL, spesso causa di rallentamenti se mal configurata.

Come ha sottolineato Takuma Inoue, Executive Officer e CTO di AI Inside, uno dei partecipanti al programma GENIAC: Queste ambiziose iniziative sono state rese possibili grazie al supporto di molte persone, inclusa AWS. Siamo profondamente grati per il loro ampio supporto. Questo evidenzia come la mentorship e le competenze specialistiche siano state fondamentali per trasformare la potenza di calcolo in risultati concreti.

Architetture di riferimento e collaborazione: la base per l'innovazione

Un altro elemento chiave del successo giapponese è stata l'adozione di solide architetture di riferimento e la promozione della collaborazione. Invece di lasciare che ogni team configurasse il proprio cluster da zero, AWS ha fornito modelli pre-validati e automazioni per due approcci principali: AWS ParallelCluster e SageMaker HyperPod. Questi “modelli” hanno coperto l'intera pila tecnologica, dal calcolo alla rete, dallo storage agli ambienti container, e sono stati resi disponibili tramite un repository GitHub per una facile implementazione. Questo ha permesso ai team di concentrarsi sullo sviluppo dei modelli, sapendo di avere una base infrastrutturale solida e ottimizzata.

La creazione di canali di comunicazione robusti, come canali Slack dedicati per la coordinazione interna e con i clienti, ha facilitato la risoluzione rapida dei problemi e la condivisione delle conoscenze. Questo approccio ha favorito una comunità di pratica, accelerando l'apprendimento collettivo e la diffusione delle migliori pratiche. Il risultato? 12 clienti hanno lanciato con successo oltre 127 istanze P5 (NVIDIA H100) e 24 istanze Trn1 (AWS Trainium1) in un solo giorno, addestrando modelli complessi come il Llama 3.1 Shisa V2 da 405 miliardi di parametri.

Cosa significa per l'Europa e l'Italia?

Il caso giapponese offre un modello prezioso per l'Europa e, in particolare, per l'Italia, che sta cercando di recuperare il gap nelle tecnologie emergenti. Come evidenziato da Agenda Digitale AI, l'Italia può recuperare il ritardo, ma serve una strategia chiara che vada oltre il semplice acquisto di hardware. L'esempio del GENIAC dimostra che la costruzione di una vera sovranità AI non è solo una questione di investimenti massicci in GPU, ma richiede una strategia olistica che includa mentorship, competenze specialistiche e un'infrastruttura cloud flessibile e potente.

Non si tratta solo di costruire “gigafactory” dell'AI, come si discute in Europa, ma di creare un ecosistema dove le startup e le aziende possano prosperare, supportate da competenze e infrastrutture adeguate. L'Indonesia, ad esempio, sta creando un piano per diventare un riferimento AI nel Sud-est asiatico, puntando su una roadmap strategica che dia una direzione chiara allo sviluppo dell'ecosistema digitale. Anche l'Italia dovrà adottare un approccio simile, investendo non solo in macchine, ma soprattutto in persone e in una visione a lungo termine che permetta di utilizzare al meglio queste risorse per creare valore reale e indipendente.