Modelli IA cinesi: perché dominano l'uso degli sviluppatori

C'è un dato che riassume meglio di mille analisi lo spostamento di baricentro dell'intelligenza artificiale: su OpenRouter — la piattaforma che instrada le richieste degli sviluppatori verso decine di modelli diversi — i modelli costruiti in Cina hanno superato quelli americani nel consumo complessivo di token. Una rilevazione di fine febbraio 2026 li dava al 61% del totale; nelle settimane successive le prime sei posizioni della classifica per token consumati erano tutte occupate da modelli cinesi.

Da meno dell'1% al primato in 18 mesi

La parabola è impressionante. Nell'ottobre 2024 i modelli cinesi pesavano circa l'1,2% del traffico su OpenRouter. Dopo l'arrivo di DeepSeek V3, a marzo 2025, la quota ha superato il 10%. Da lì è stata una valanga: Qwen di Alibaba, Kimi di Moonshot, GLM di Zhipu, MiniMax e lo stesso DeepSeek con la nuova generazione V4 hanno scalato la classifica fino a guidarla. In una settimana di inizio aprile 2026, un singolo modello — Qwen nella sua variante gratuita — ha superato i 4.600 miliardi di token consumati.

In 18 mesi i modelli cinesi sono passati da meno dell'1% al primato nel consumo di token su OpenRouter.

Tre ragioni: costo, licenze aperte, flussi agentici

Perché gli sviluppatori di tutto il mondo, Italia compresa, scelgono sempre più spesso modelli cinesi? La prima ragione è il prezzo: spesso costano dalle 10 alle 20 volte meno delle alternative americane di pari livello. In applicazioni che bruciano milioni di token al giorno — assistenti, agenti, pipeline di analisi documentale — la differenza sulla bolletta è enorme.

La seconda è la licenza. Molti di questi modelli sono open-weight (Qwen, DeepSeek, GLM, Kimi rilasciano i pesi, spesso con licenze permissive come la MIT): si possono scaricare, eseguire sui propri server, mettere a punto sui propri dati e usare senza dipendere da un singolo fornitore. Per chi ha vincoli di privacy o di sovranità del dato è un vantaggio decisivo.

La terza è la qualità nei compiti «agentici»: i modelli cinesi si sono specializzati nella programmazione e nei flussi a più passaggi, dove vengono usati in modo intensivo. Il partner di Andreessen Horowitz Martin Casado ha stimato che circa l'80% delle startup che adottano stack di IA open-source giri oggi su modelli cinesi.

Cosa significa per il mercato e per la geopolitica

La conseguenza più immediata è una pressione fortissima sui prezzi dei laboratori occidentali, costretti a giustificare tariffe molto più alte con un vantaggio di qualità che in diversi benchmark si è assottigliato. DeepSeek V4-Pro, per esempio, sfiora i risultati di Claude Opus 4.7 sul test di programmazione SWE-bench, a una frazione del costo.

C'è poi il versante politico. Negli Stati Uniti l'uso massiccio di modelli cinesi nelle infrastrutture software solleva interrogativi su dipendenza tecnologica e sicurezza, mentre Washington tiene il punto sui controlli all'export dei chip. Per l'Europa, il quadro è ambivalente: da un lato i modelli aperti cinesi abbassano le barriere d'ingresso e favoriscono la sovranità digitale di chi li esegue in casa; dall'altro pongono domande su trasparenza dei dati di addestramento e conformità all'AI Act.

La concorrenza cinese spinge al ribasso i prezzi dei modelli occidentali.

Una scelta tecnica, non una bandiera

Va detto con chiarezza: la classifica di OpenRouter misura l'uso da parte degli sviluppatori, non la qualità assoluta o l'affidabilità per ogni scenario. I modelli americani restano spesso davanti sul ragionamento difficile e sulla conoscenza fattuale, e per molte aziende contano garanzie contrattuali, supporto e questioni di compliance che vanno oltre il prezzo per token. Ma il messaggio di fondo è inequivocabile: l'epoca in cui «IA» voleva dire automaticamente «modello americano» è finita. Oggi chi costruisce prodotti sceglie sulla base di costo, apertura e prestazioni nel compito specifico — e sempre più spesso quella scelta porta a un modello cinese.