Mistral e la propaganda russa: il test estone su 60 modelli

Il modello più avanzato di Mistral, la più importante azienda europea di intelligenza artificiale, si è classificato 47° su 60 in un test sulla capacità di riconoscere la propaganda del Cremlino. Il dato, diffuso il 16 giugno 2026, arriva da uno studio dell'Istituto della Lingua Estone (Eesti Keele Instituut), ente finanziato dal governo di Tallinn, e ha riacceso il dibattito sulla vulnerabilità dei chatbot alla disinformazione russa.

Come è stato costruito il test

I ricercatori hanno sottoposto 60 sistemi di IA generativa a una batteria di 75 domande, poste in inglese, russo ed estone. L'obiettivo era misurare quanto ciascun modello sapesse identificare i tentativi di manipolazione e rifiutarsi di rilanciare narrazioni propagandistiche. I temi erano i grandi classici della comunicazione del Cremlino: la presunta «evacuazione legittima» dei bambini ucraini, le promesse che la NATO avrebbe violato sull'allargamento a Est, la negazione dell'esistenza di identità distinte tra russi, ucraini e bielorussi, e il racconto dell'Unione Sovietica come pacifica liberatrice.

Il test misurava la resistenza dei chatbot alle narrazioni di disinformazione.

Mistral sotto il 40%, meglio i modelli cinesi e Claude

Tutte e quattro le versioni di Mistral incluse nell'analisi hanno ottenuto meno del 40% nella capacità di individuare fonti classificate come propaganda russa. Il modello di punta dell'azienda francese si è fermato al 47° posto della classifica generale. A fare meglio, secondo lo studio ripreso da Il Sole 24 Ore e da Euronews, sono stati diversi modelli sviluppati in Cina, oltre a Claude di Anthropic e ad alcune versioni di Grok.

Il risultato è paradossale per più di un motivo. Mistral è il fiore all'occhiello dell'IA europea, l'azienda che governi e istituzioni indicano come alternativa «sovrana» ai colossi americani e cinesi. E il fatto che modelli cinesi battano un campione europeo proprio nel riconoscere la disinformazione del Cremlino ribalta molte aspettative sul rapporto tra origine geografica di un modello e affidabilità.

Modelli commerciali più sicuri di quelli aperti

Una delle indicazioni più interessanti riguarda la differenza tra modelli chiusi e modelli a pesi aperti. Secondo Arvi Tavast, direttore dell'Istituto della Lingua Estone, «i modelli commerciali appaiono più sicuri e più resistenti di quelli open source». La ragione probabile sta nei filtri e negli allineamenti aggiuntivi che le aziende applicano ai prodotti destinati al pubblico, e che spesso mancano nelle versioni scaricabili liberamente.

È un punto che riguarda da vicino chi sceglie un modello per usi sensibili: assistenza ai cittadini, scuola, informazione. La trasparenza dei pesi aperti, preziosa per ricerca e personalizzazione, non garantisce di per sé una migliore capacità di filtrare le manipolazioni.

Cosa cambia per chi usa i chatbot in Europa

Lo studio non sostiene che Mistral «diffonda» deliberatamente propaganda, ma che fatichi a riconoscerla e a smontarla quando l'utente pone domande costruite su premesse false. Per un cittadino che usa un assistente per informarsi su guerra, geopolitica o storia recente, significa che la risposta può recepire, senza adeguate cautele, framing tipici della disinformazione.

Il tema si intreccia con il lavoro che la Commissione europea sta portando avanti sull'etichettatura dei contenuti generati dall'IA e sul contrasto alla manipolazione informativa. Per Mistral, che proprio in questi giorni era seduta al tavolo del G7 come unica azienda di frontiera europea, è un richiamo a investire non solo sulle prestazioni dei modelli, ma anche sulla loro robustezza di fronte agli abusi.

I dati riportati provengono dallo studio dell'Istituto della Lingua Estone, ripreso da Il Sole 24 Ore, Euronews e key4biz; AI Notizie non ha avuto accesso diretto al dataset completo del test.