IA low cost: Claude contro DeepSeek e il rischio IPO

Lo stesso compito aziendale — analizzare documenti, rispondere a centinaia di ticket, generare codice — può costare 4.811 dollari se affidato a Claude di Anthropic oppure 1.071 dollari se eseguito con DeepSeek. La cifra, calcolata dalla CNBC il 20 maggio 2026 su un carico di lavoro standard, riassume in due numeri il problema che agita gli investitori proprio mentre OpenAI e Anthropic si avvicinano alla Borsa: i modelli più bravi sono anche i più cari, e i rivali low cost — spesso cinesi e a pesi aperti — stanno diventando «abbastanza buoni» per la maggior parte dei compiti reali.

Lo stesso lavoro costa quattro volte di più con Claude

Il confronto non riguarda la qualità assoluta, ma il rapporto tra prestazioni e prezzo. Sui benchmark di ragionamento e coding i modelli di punta americani restano in testa, ma il margine si è assottigliato al punto che, per attività ad alto volume e a basso rischio, pagare quattro o cinque volte di più non si giustifica più. Un help desk che smista migliaia di richieste, un servizio che riassume contratti o un assistente che genera bozze di email non ha bisogno del modello più potente del mondo: gli basta uno affidabile e a buon mercato.

È la logica che sta spostando enormi volumi di richieste verso modelli a costo ridotto. E quando il costo per token crolla, crolla anche il margine che giustifica le valutazioni a dieci e undici cifre dei laboratori di frontiera.

Le valutazioni dei laboratori di IA sono sotto pressione per il calo del prezzo dell'inferenza.

Come i modelli cinesi hanno conquistato OpenRouter

Il segnale più netto arriva da OpenRouter, la piattaforma che permette agli sviluppatori di accedere a centinaia di modelli con un'unica interfaccia e che funziona come un buon termometro delle scelte di chi costruisce prodotti. Qui i modelli cinesi sono passati da circa l'1% del traffico nel 2024 a oltre il 60% a maggio 2026. Nomi come DeepSeek V4, Qwen di Alibaba e Kimi di Moonshot vengono scelti non per patriottismo, ma perché offrono prestazioni vicine ai modelli chiusi a una frazione del prezzo, spesso con licenze aperte che consentono di eseguirli sui propri server.

DeepSeek ha rilasciato i modelli V4-Pro e V4-Flash il 22 aprile 2026 con licenza MIT e pesi scaricabili: chiunque può installarli senza pagare un'API. Per un'azienda che gestisce volumi enormi, eseguire un modello aperto sul proprio hardware significa trasformare un costo variabile e crescente in un costo fisso controllabile.

Perché conta per le IPO da mille miliardi

Il tempismo è tutto. OpenAI è valutata circa 852 miliardi di dollari sul mercato privato e punta a una quotazione che la stampa finanziaria stima vicina ai mille miliardi; Anthropic, dal canto suo, ha comunicato di essere avviata verso il primo trimestre in utile operativo. Ma il modello di business di entrambe poggia sull'idea che i clienti continueranno a pagare un sovrapprezzo per i modelli migliori.

Se invece il valore si sposta verso l'inferenza a basso costo — dove la concorrenza è feroce e i margini sottili — la narrativa cambia. Gli analisti citati dalla CNBC avvertono che «l'IA a buon mercato» potrebbe erodere proprio la premessa su cui si fondano le valutazioni record. Non è un problema di domanda, che resta in crescita esplosiva, ma di chi riuscirà a catturarne il valore economico.

Eseguire modelli aperti sul proprio hardware sposta il costo dall'API all'infrastruttura.

Cosa cambia per chi usa l'IA in azienda

Per le imprese italiane ed europee la lezione è concreta: conviene ragionare per «portafoglio di modelli» invece che affidarsi a un unico fornitore. La pratica che si sta diffondendo è il routing intelligente: assegnare ai modelli costosi solo i compiti che richiedono davvero il loro livello (ragionamento complesso, codice critico, analisi delicate) e dirottare tutto il resto su modelli economici o aperti.

Misurare il costo per richiesta, non solo il prezzo per milione di token: un modello più lento o più verboso può costare di più a parità di risultato.
Testare i modelli aperti (DeepSeek, Qwen, Kimi, Mistral) sui propri casi d'uso prima di assumere che servano i modelli di frontiera.
Valutare l'esecuzione in locale o su cloud sovrano per dati sensibili, dove il vincolo non è solo il prezzo ma anche la privacy.

La conseguenza più profonda è strategica: la rendita di posizione dei laboratori americani — l'idea che il modello migliore basti a giustificare qualsiasi prezzo — non è più garantita. La domanda che il mercato si pone alla vigilia delle grandi quotazioni non è più «chi ha il modello più bravo», ma «chi guadagnerà quando l'intelligenza diventerà una commodity».

Questo articolo incrocia l'analisi della CNBC con i dati pubblici di OpenRouter e i rilasci ufficiali dei laboratori; le cifre sui costi si riferiscono al carico di lavoro tipo citato dalla CNBC e non a un listino ufficiale.