Google lancia Gemini Omni per la generazione e modifica video

Martedì, 19 maggio 2026 (UTC), Google ha annunciato ufficialmente il lancio del Gemini Omni, il suo nuovo modello multimodale per la generazione e modifica conversazionale di video, durante il keynote principale del Google I/O 2026 a Mountain View. Il lancio rappresenta il primo passo pratico dell'azienda nell'architettura integrata di elaborazione dei media unificata, combinando avanzate capacità di fisica del mondo reale e intelligenza cognitiva. Lo strumento viene distribuito gradualmente a partire da oggi per gli abbonati dei piani a pagamento del marchio.
Secondo il comunicato ufficiale dell'azienda sul palco dell'evento, la versione di debutto è stata chiamata Gemini Omni Flash, offrendo un'operazione agile e integrata direttamente nella chat dell'intelligenza artificiale. La tecnologia è stata sviluppata in collaborazione diretta con la divisione Google DeepMind, unificando l'intelligenza contestuale con i sistemi di generazione cinematografica del motore Veo, permettendo che la modifica avvenga tramite semplici istruzioni di linguaggio naturale in una singola conversazione.
Visione Multimodale e Funzionalità Conversazionali
La grande innovazione di Gemini Omni risiede nella sua natura unificata di elaborazione dei dati. A differenza delle soluzioni concorrenti sul mercato che operano in compartimenti separati per la generazione di video, la novità consente la creazione di contenuti audiovisivi da qualsiasi combinazione di testo, immagini e audio. Le funzionalità di editing conversazionale permettono all'utente di richiedere aggiustamenti in modo iterativo direttamente nella chat, come riscaldare la palette di colori di una scena, aggiungere effetti di slow motion, rimuovere oggetti di sfondo o remixare la composizione estetica del materiale finale rapidamente.
L'ingegneria del modello ha migliorato in modo percettibile la comprensione delle leggi della fisica del mondo reale. I video generati mostrano movimenti più naturali di fluidi e gravità, oltre a presentare una coerenza temporale migliorata di oggetti tridimensionali, prevenendo distorsioni visive comuni nelle intelligenze video della generazione passata.
Disponibilità, Abbonamenti e Quote Giornaliere
Il servizio ha iniziato ad essere rilasciato questo martedì in modo graduale per gli abbonati in tutto il mondo tramite l'applicazione di Gemini e l'ecosistema Flow by Google, ed è inoltre programmato per debuttare negli strumenti di YouTube, compreso l'applicazione YouTube Create, senza costi aggiuntivi per i creatori idonei.
Il modello Gemini Omni Flash è incluso nel pacchetto Google AI Pro, che ha un costo ricorrente di 19,99 dollari al mese. Tuttavia, utenti aziendali e sviluppatori segnalano che le quote di consumo iniziali sono piuttosto limitate, con frequenti rapporti che indicano che la generazione di soli 2 o 4 video complessi può esaurire tutta la capacità giornaliera disponibile del piano Pro, generando periodi di restrizione fino a 5 ore nell'accesso per l'elaborazione di nuovi media. Per produzioni cinematografiche su larga scala, Google ha messo a disposizione il piano Ultra a 249,99 dollari mensili, concedendo una quota espansa contenente tra 200 e 25.000 crediti di utilizzo nell'ambiente Flow.
Questo contenuto è stato creato e revisionato dal nostro team (iatoskill.com), se riscontri problemi, contattaci


