Baseten, round da 1,5 miliardi: boom dell'inferenza

Il denaro che insegue l'intelligenza artificiale si sta spostando. Non piu' solo verso chi addestra i modelli di frontiera, ma verso chi li fa girare in produzione, milione di richieste dopo milione di richieste. Lo certifica il round annunciato a fine giugno da Baseten, societa' di San Francisco che vende il software per eseguire carichi di lavoro IA: 1,5 miliardi di dollari di Series F a una valutazione di 13 miliardi. E' il quarto aumento di capitale in 18 mesi per l'azienda e il piu' grande finanziamento di venture capital della settimana.

A guidare il round, secondo i dati raccolti da Crunchbase, ci sono Altimeter Capital, Conviction Partners, Spark Capital, Sands Capital e Wellington Management. Ma Baseten e' solo la punta di un iceberg fatto di capitali che, in pochi giorni, si sono riversati sull'infrastruttura dell'IA piu' che sui modelli.

Perche' l'inferenza e' la nuova frontiera degli investimenti

Per anni il racconto dell'IA ha ruotato attorno all'addestramento: chi aveva piu' GPU e piu' dati costruiva i modelli migliori. Oggi che modelli potenti sono disponibili a decine - dai GPT di OpenAI ai Claude di Anthropic fino agli open-weight cinesi - il collo di bottiglia si e' spostato sull'inferenza, cioe' sul costo e sulla velocita' con cui quei modelli rispondono agli utenti. Ottimizzare l'inferenza significa pagare meno per ogni risposta, ridurre la latenza e, in ultima analisi, rendere sostenibile un'applicazione IA. Ed e' esattamente il mercato in cui operano Baseten e i suoi concorrenti.

La logica economica e' semplice ma spietata: un'applicazione che serve milioni di utenti spende molto piu' in inferenza che in addestramento, perche' l'addestramento si fa una volta mentre l'inferenza si ripete a ogni interazione. Chi riesce a comprimere quel costo - con software piu' efficiente, chip dedicati o tecniche di compressione dei modelli - regala ai propri clienti margini che altrimenti finirebbero in bolletta energetica e affitto di GPU.

La sfida si e' spostata dall'addestramento all'esecuzione efficiente dei modelli.

Gli altri mega-round della settimana

Accanto a Baseten, la lista delle operazioni piu' rilevanti racconta la stessa storia. Groq, che produce chip e cloud per l'inferenza, ha incassato un round di crescita da 650 milioni (investitori Infinitum e Disruptive) appena sei mesi dopo che Nvidia ne aveva assunto il fondatore e parte del team, licenziandone la tecnologia. General Intuition, startup newyorchese che costruisce un modello di base addestrato sul gameplay dei videogiochi, ha raccolto 320 milioni di Series A con Khosla Ventures capofila, Jeff Bezos e General Catalyst, per una valutazione di 2,3 miliardi. Mirendil, nuovo laboratorio di frontiera focalizzato su sistemi che eccellono nella ricerca e sviluppo sull'IA, ha chiuso un seed monstre da 200 milioni con Andreessen Horowitz, Kleiner Perkins e Nvidia. Infine Upscale AI, che lavora sull'infrastruttura di rete per l'IA, ha aggiunto 190 milioni a una Series A guidata da Premji Invest, a una valutazione di 2 miliardi.

Colpisce la ricorrenza di alcuni nomi tra gli investitori - Nvidia compare in piu' round, sia direttamente sia attraverso le aziende che acquista talenti e tecnologie - segno di un ecosistema in cui chi domina l'hardware estende la propria presa anche sul software e sui nuovi laboratori.

Un mercato che corre piu' veloce dei ricavi

Sommati, questi soli cinque round superano abbondantemente i 2,8 miliardi di dollari in una settimana, e si inseriscono in un anno gia' da record: il primo trimestre 2026 aveva visto il venture capital globale toccare circa 300 miliardi di dollari, sospinto proprio dall'IA, mentre OpenAI ha chiuso una raccolta da 122 miliardi a una valutazione di 852 miliardi. La concentrazione su poche aziende e su una sola tecnologia alimenta pero' i timori di chi vede una bolla: valutazioni come i 13 miliardi di Baseten o i 2,3 di General Intuition incorporano aspettative di crescita enormi, che dovranno tradursi in ricavi e margini reali.

C'e' anche un riflesso piu' vicino a noi. Per le startup europee e italiane che costruiscono prodotti sopra questi modelli, l'esistenza di un mercato dell'inferenza ricco e competitivo e' una buona notizia: piu' fornitori significano prezzi piu' bassi e maggiore scelta. Il rovescio della medaglia e' la dipendenza da una manciata di operatori quasi tutti statunitensi, un tema che si intreccia con il dibattito europeo sulla sovranita' tecnologica e sulla necessita' di capacita' di calcolo autonoma.

Per ora il mercato scommette su una tesi semplice: se l'IA diventera' davvero l'infrastruttura su cui gira una fetta crescente dell'economia digitale, chi costruisce i "tubi" - i sistemi di inferenza, i chip, le reti - sara' redditizio quanto e piu' di chi costruisce i modelli. La prossima fase, quella in cui i conti dovranno reggere il peso delle valutazioni, dira' se la scommessa era fondata.