Google lance Gemini Omni pour la création et l'édition de vidéos

Une photo amateur d'un bureau en bois avec un écran montrant un éditeur vidéo numérique et un iPad ouvert affichant l'étincelle bleue brillante de Gemini.

Ce mardi 19 mai 2026 (UTC), Google a annoncé officiellement le lancement de Gemini Omni, son nouveau modèle multimodal de génération et d'édition conversationnelle de vidéos, lors du discours principal du Google I/O 2026 à Mountain View. Ce lancement marque le premier pas concret de l'entreprise vers une architecture intégrée de traitement des médias unifiés, combinant des capacités avancées de physique du monde réel et d'intelligence cognitive. L'outil est progressivement déployé à partir d'aujourd'hui pour les abonnés des plans payants de la marque.

Selon le communiqué officiel de l'entreprise lors de l'événement, la version inaugurale a été nommée Gemini Omni Flash, offrant une opération agile et intégrée directement dans le chat de l'intelligence artificielle. La technologie a été développée en partenariat direct avec la division Google DeepMind, unifiant l'intelligence contextuelle avec les systèmes de génération cinématographique du moteur Veo, permettant ainsi de réaliser l'édition à travers des instructions simples en langage naturel au sein d'une seule conversation.

Vision multimodale et fonctionnalités conversationnelles

La grande innovation de Gemini Omni réside dans sa nature unifiée de traitement des données. Contrairement aux solutions concurrentes sur le marché qui opèrent dans des silos séparés de génération vidéo, cette nouveauté permet la création de contenu audiovisuel à partir de toute combinaison de texte, d'images et de son. Les fonctionnalités d'édition conversationnelle permettent à l'utilisateur de demander des ajustements de manière itérative directement dans le chat, comme réchauffer la palette de couleurs d'une scène, ajouter des effets de ralenti, supprimer des objets d'arrière-plan ou remixer la composition esthétique du matériel final rapidement.

L'ingénierie du modèle a sensiblement amélioré la compréhension des lois de la physique du monde réel. Les vidéos générées démontrent des mouvements plus naturels des fluides et de la gravité, ainsi qu'une cohérence temporelle améliorée des objets tridimensionnels, évitant les distorsions visuelles courantes dans les intelligences vidéo de la génération précédente.

Disponibilité, abonnements et quotas quotidiens

Le service a commencé à être déployé ce mardi de manière progressive pour les abonnés du monde entier via l'application Gemini et l'écosystème Flow by Google, et est également prévu pour être intégré aux outils de YouTube, y compris l'application YouTube Create, sans frais supplémentaires pour les créateurs éligibles.

Le modèle Gemini Omni Flash est inclus dans le forfait Google AI Pro, qui coûte 19,99 USD par mois. Cependant, les utilisateurs professionnels et les développeurs signalent que les quotas de consommation initiaux sont assez limités, avec des rapports fréquents indiquant que la génération de seulement 2 à 4 vidéos complexes peut épuiser toute la capacité quotidienne disponible du plan Pro, entraînant des périodes de restriction pouvant aller jusqu'à 5 heures pour le traitement de nouveaux médias. Pour les productions cinématographiques à grande échelle, Google a mis à disposition le plan Ultra pour 249,99 USD par mois, offrant un quota élargi contenant entre 200 et 25 000 crédits d'utilisation dans l'environnement Flow.

Partager

Ce contenu a été créé et révisé par notre équipe (iatoskill.com), si vous rencontrez un problème, contactez-nous

Ce contenu a-t-il été utile ?
Apprenez

Plus d'Actualités

Voir Tout
Google lance Gemini Omni pour la création et l'édition de vidéos