OpenAI Jalapeño: il primo chip IA con Broadcom

OpenAI ha presentato il 24 giugno 2026 il suo primo chip progettato in casa: si chiama Jalapeño, e' un acceleratore pensato esclusivamente per l'inferenza (cioe' per far girare i modelli gia' addestrati quando rispondono agli utenti) ed e' stato sviluppato insieme a Broadcom. L'annuncio segna il momento in cui l'azienda di Sam Altman smette di essere solo un cliente di Nvidia e prova a costruirsi una fetta del proprio hardware, sulla scia di quanto hanno gia' fatto Google con i suoi TPU e Amazon con Trainium e Inferentia.

Cos'e' Jalapeño e a cosa serve

Jalapeño non e' una GPU general-purpose come quelle di Nvidia, ma un ASIC, cioe' un circuito integrato disegnato per fare una cosa sola nel modo piu' efficiente possibile: in questo caso, eseguire i modelli linguistici di OpenAI in produzione. Secondo i materiali diffusi dall'azienda, il chip e' un singolo die di dimensioni vicine al limite fisico della litografia (un "reticle-sized ASIC", nel gergo dei tecnici), ottimizzato per ridurre il consumo energetico per ogni risposta generata.

Il punto chiave e' proprio questo: OpenAI dice che Jalapeño offre prestazioni-per-watt nettamente superiori alle alternative attualmente in uso, con un occhio particolare ai modelli di coding in tempo reale, sempre piu' centrali nei suoi prodotti come Codex. Tradotto: l'obiettivo numero uno e' tagliare i costi di esercizio, voce che per un'azienda che brucia miliardi in calcolo pesa quanto e piu' della ricerca.

Jalapeño e' un ASIC dedicato all'inferenza, non una GPU general-purpose. Foto: Pexels.

Nove mesi dal disegno alla produzione

L'aspetto che ha colpito di piu' gli addetti ai lavori e' la velocita'. OpenAI e Broadcom affermano di aver portato Jalapeño dal disegno iniziale al tape-out (la consegna del progetto definitivo alla fabbrica) in appena nove mesi: un tempo che, se confermato, sarebbe tra i piu' rapidi mai visti per un chip ad alte prestazioni di questa complessita'. A rendere possibile la corsa, racconta l'azienda, sono stati anche i suoi stessi modelli, usati per accelerare alcune fasi di progettazione e verifica.

Il chip nasce dentro un accordo piu' ampio annunciato mesi fa tra le due aziende, che prevede lo sviluppo di acceleratori personalizzati per diversi gigawatt di capacita'. Broadcom mette la sua esperienza nel disegno di ASIC e nella connettivita' di rete, mentre OpenAI definisce le specifiche pensando ai propri carichi di lavoro. I primi esemplari, fanno sapere le aziende, dovrebbero entrare in funzione entro la fine del 2026, con un'espansione "negli anni a venire".

Perche' OpenAI vuole il suo silicio

La mossa ha una logica industriale precisa. Oggi praticamente tutta l'inferenza di ChatGPT gira su GPU Nvidia, che restano costose e contese: chi controlla il proprio hardware controlla i margini e riduce la dipendenza da un unico fornitore. Google lo ha capito anni fa con i TPU, Amazon ha seguito con i suoi chip per AWS, Meta e Microsoft hanno progetti analoghi. Con Jalapeño, OpenAI entra ufficialmente in questo club e prova, nelle sue parole, a "costruire l'intero stack", dal modello al chip che lo esegue.

Restano molte incognite. OpenAI e Broadcom non hanno reso pubblici dettagli come il nodo produttivo o il fornitore di memoria, e un chip da datacenter si giudica solo quando entra in produzione su larga scala: la storia recente e' piena di acceleratori promettenti sulla carta e deludenti nel mondo reale. Jalapeño, inoltre, e' specializzato sull'inferenza e non sostituisce le GPU usate per addestrare i modelli, dove Nvidia resta dominante. Non e' un divorzio, insomma, ma il segnale che anche il piu' grande cliente di Nvidia vuole smettere di dipendere solo da lei.

Cosa cambia per il mercato

Per gli utenti e le aziende che usano le API di OpenAI, l'effetto immediato sara' nullo: i chip arriveranno gradualmente e dietro le quinte. Ma se le promesse sull'efficienza energetica si concretizzano, nel medio periodo potrebbero tradursi in costi piu' bassi o in margini piu' sani per OpenAI, in un momento in cui la sostenibilita' economica dell'IA generativa e' al centro del dibattito. Per Nvidia, il messaggio e' che i suoi clienti piu' grandi sono anche i suoi futuri concorrenti sull'inferenza; per Broadcom, invece, e' un'altra conferma del ruolo crescente di partner silenzioso dietro i chip su misura dei colossi dell'IA.