Per insegnare a un robot ad afferrare un oggetto o a un'auto a riconoscere un pedone non basta un modello che capisce il testo: serve un modello che capisce il mondo fisico. E proprio questo che NVIDIA ha aggiornato al Computex 2026 con Cosmos 3, un "world foundation model" pensato per la robotica e i veicoli autonomi, rilasciato come modello aperto.
Che cos'e un world model
Un world model e un'IA addestrata a comprendere e simulare come si comporta la realta fisica: come cadono gli oggetti, come si muovono i corpi, cosa succede quando una mano spinge una scatola. NVIDIA descrive Cosmos 3 come un omnimodel basato su un'architettura mixture-of-transformers, capace di imparare da teleoperazione, simulazioni e video re-proiettati per comprendere e simulare ambienti fisici da piu prospettive. In pratica, e un simulatore intelligente del mondo reale.
A cosa serve concretamente
Il problema piu grande della robotica non e l'hardware, ma i dati: addestrare un robot nel mondo reale e lento, costoso e a volte pericoloso. Un world model come Cosmos 3 permette di generare dati sintetici realistici, cioe migliaia di scenari virtuali (luci diverse, ostacoli, oggetti, situazioni di errore) su cui un robot puo allenarsi prima di toccare il mondo fisico. NVIDIA dichiara per Cosmos 3 i primi posti in benchmark dedicati alla comprensione fisica come Physics-IQ, PAI-Bench, RoboLab e RoboArena.
Cosmos 3 non viaggia da solo: si inserisce nella piattaforma di robotica di NVIDIA accanto a Isaac GR00T, il software per addestrare robot umanoidi (con i modelli GR00T pre-addestrati su migliaia di ore di dati umani), e all'Isaac GR00T Reference Humanoid Robot, un robot di riferimento basato su Jetson Thor. L'idea e fornire l'intero stack: il "cervello" che capisce il mondo, gli strumenti per simularlo e l'hardware per metterlo alla prova.
Le versioni: Super e Nano
Cosmos 3 arriva in piu varianti per esigenze diverse. La versione Super punta alla massima qualita per chi genera dati di addestramento su grande scala; la versione Nano e piu leggera e pensata per essere eseguita vicino al robot, dove servono risposte rapide e poca latenza. E la stessa logica che vediamo nei modelli linguistici, declinata sul mondo fisico: un modello grande per il lavoro pesante, uno piccolo per girare "sul campo".
Dove trovarlo e come provarlo
Cosmos 3 e disponibile come modello aperto. I percorsi principali per accedervi sono:
- Hugging Face: per scaricare i pesi dei modelli Cosmos e integrarli nei propri progetti (serve hardware NVIDIA adeguato, soprattutto per la variante Super).
- build.nvidia.com: per esplorare i modelli come microservizi NIM e provarli senza configurare tutto da zero.
- la documentazione della piattaforma Cosmos e di Isaac sul sito NVIDIA, che spiega come collegare il world model al flusso di simulazione e addestramento.
Un flusso tipico, semplificato, e questo: si parte da pochi esempi reali (anche solo video di teleoperazione), si usa Cosmos 3 per ampliarli in tanti scenari sintetici variati, si addestra il modello di controllo del robot (ad esempio con Isaac GR00T) su questi dati e infine si testa il comportamento in simulazione prima di passare al robot fisico. E il modo in cui la robotica moderna riduce drasticamente i tempi e i costi di sviluppo.
Per chi e questa novita
Cosmos 3 non e uno strumento per l'utente comune: parla a chi sviluppa robot, sistemi di guida autonoma o applicazioni di "physical AI". Per tutti gli altri, pero, e un segnale importante di dove sta andando il settore. Dopo anni in cui l'IA ha imparato a scrivere, programmare e generare immagini, la prossima frontiera e farle capire e manipolare il mondo reale. Mettere a disposizione, in forma aperta, un modello che simula la fisica e uno dei tasselli che potrebbero accelerare l'arrivo dei robot umanoidi nelle fabbriche e, un domani, nelle case.




