Gemini Omni: generare e modificare video con l'IA di Google

Al Google I/O del 19 maggio 2026 Google ha presentato Gemini Omni, un nuovo modello multimodale capace, nelle parole dell'azienda, di «creare qualsiasi cosa a partire da qualsiasi input — iniziando dal video». La prima versione disponibile si chiama Omni Flash ed è pensata per generare e modificare clip combinando testo, immagini, audio e altri video, il tutto guidandola con il linguaggio naturale, come in una conversazione.

Cosa sa fare davvero

Gemini Omni non è solo un generatore di video «da prompt». La novità è la capacità di partire da materiali diversi — una foto, una traccia audio, uno spezzone esistente, una descrizione testuale — e fonderli in un risultato coerente, modificabile passo dopo passo. Si può chiedere di cambiare un'inquadratura, aggiungere un movimento di camera, applicare uno stile, inserire un soggetto. Omni Flash, in particolare, migliora la coerenza dei personaggi: identità e voce restano stabili da una scena all'altra, uno dei problemi storici dei video generati dall'IA.

Il modello sfrutta la conoscenza di Gemini su fisica, storia e contesto culturale per produrre risultati più «plausibili»: utile, ad esempio, per video esplicativi di concetti complessi, dove conta che ciò che si vede sia accurato e non solo bello.

Omni Flash mantiene coerenti identità e voce dei personaggi tra una scena e l'altra.

Dove provarlo: gratis e a pagamento

Google ha scelto una distribuzione su più livelli:

Gratis: Gemini Omni arriva dentro YouTube Shorts e l'app YouTube Create, con la funzione «Remix» che permette di entrare in uno Short e chiedere modifiche (ad esempio aggiungere se stessi o un riferimento visivo). È il modo più immediato per toccare con mano la tecnologia senza pagare.
A pagamento: gli abbonati a Google AI Plus, AI Pro e AI Ultra accedono al modello completo dentro l'app Gemini e in Google Flow, lo strumento di Google per la creazione video professionale, disponibile a livello globale.
API: l'accesso per sviluppatori e aziende è atteso «nelle prossime settimane», presumibilmente via Gemini API e Google AI Studio.

Attenzione ai limiti del piano gratuito: la versione dentro YouTube è pensata per clip brevi e usi creativi leggeri, mentre l'app Gemini e Flow offrono controllo, durata e qualità superiori.

Come iniziare, passo per passo

Apri l'app Gemini (o, per la versione gratuita, YouTube e prova un Short con il tasto «Remix»).
Scrivi una descrizione di ciò che vuoi ottenere, oppure carica un'immagine o un breve video di partenza.
Lascia generare la prima bozza, poi itera a voce o per iscritto: «rendi l'illuminazione più calda», «aggiungi un lento zoom in avanti», «mantieni lo stesso personaggio ma cambia lo sfondo».
Esporta la clip quando il risultato ti soddisfa.

Un esempio di prompt da incollare:

«Crea una clip di 8 secondi: un barista italiano prepara un cappuccino in un bar luminoso al mattino. Stile realistico, luce calda, camera che si avvicina lentamente alla tazza. Mantieni lo stesso barista in tutte le inquadrature.»

Il risultato atteso è una breve sequenza coerente, con il soggetto stabile tra i diversi fotogrammi e un movimento di camera fluido — proprio il tipo di continuità che Omni Flash promette di garantire.

La versione gratuita vive dentro YouTube Shorts; la più potente nell'app Gemini e in Google Flow.

Come si colloca rispetto ai rivali

Gemini Omni entra in un campo affollato: Sora di OpenAI, Veo della stessa Google, oltre a Runway, Pika, Luma e ai modelli cinesi come Kling e Seedance. Il punto di forza dichiarato di Omni è l'integrazione: vivere dentro prodotti che miliardi di persone già usano (YouTube, l'app Gemini) e combinare in un solo modello generazione e capacità di ragionamento. Per i creator italiani significa una barriera d'ingresso bassissima — si parte da YouTube, gratis — con la possibilità di salire di livello quando servono durata, qualità e controllo professionale.

Come per ogni contenuto generato dall'IA, vale la regola del buon senso e della trasparenza: indicare quando un video è sintetico, evitare usi ingannevoli e rispettare i diritti delle persone e dei marchi rappresentati. Google applica sistemi di watermarking ai contenuti generati, in linea con le richieste in arrivo anche dall'AI Act europeo sulla marcatura dei materiali artificiali.