Google lanza Gemini Omni para generación y edición de video

Una foto amateur de una mesa de trabajo de madera con una pantalla mostrando un editor de video digital y un iPad abierto exhibiendo la chispa azul brillante de Gemini.

Este martes, 19 de mayo de 2026 (UTC), Google anunció oficialmente el lanzamiento de Gemini Omni, su nuevo modelo multimodal de generación y edición conversacional de video, durante la presentación principal del Google I/O 2026 en Mountain View. Este lanzamiento representa el primer paso práctico de la empresa hacia una arquitectura integrada de procesamiento de medios unificados, combinando avanzadas capacidades de física del mundo real e inteligencia cognitiva. La herramienta se está distribuyendo gradualmente a partir de hoy para los suscriptores de los planes pagos de la marca.

Según el comunicado oficial de la empresa en el evento, la versión de estreno fue nombrada Gemini Omni Flash, ofreciendo una operación ágil e integrada directamente en el chat de la inteligencia artificial. La tecnología fue desarrollada en colaboración directa con la división Google DeepMind, unificando la inteligencia contextual con los sistemas de generación cinematográfica del motor Veo, permitiendo que la edición se realice mediante instrucciones simples de lenguaje natural en una sola conversación.

Visión Multimodal y Recursos Conversacionales

La gran innovación de Gemini Omni radica en su naturaleza unificada de procesamiento de datos. A diferencia de las soluciones competidoras en el mercado que operan en silos separados de generación de video, esta novedad permite la creación de contenido audiovisual a partir de cualquier combinación de texto, imágenes y audio. Los recursos de edición conversacional posibilitan que el usuario solicite ajustes de forma iterativa directamente en el chat, como calentar la paleta de colores de una escena, añadir efectos de cámara lenta, eliminar objetos del fondo o remezclar la composición estética del material final de forma rápida.

La ingeniería del modelo mejoró de manera perceptible la comprensión de las leyes de la física del mundo real. Los videos generados demuestran movimientos más naturales de fluidos y gravedad, además de presentar una consistencia temporal mejorada de objetos tridimensionales, previniendo distorsiones visuales comunes en inteligencias de video de generaciones pasadas.

Disponibilidad, Suscripciones y Cuotas Diarias

El servicio comenzó a liberarse este martes de forma gradual para suscriptores en todo el mundo a través de la aplicación de Gemini y el ecosistema Flow by Google, además de estar programado para estrenarse en herramientas de YouTube, incluido el aplicativo YouTube Create, sin costos adicionales para creadores elegibles.

El modelo Gemini Omni Flash está incluido en el paquete Google AI Pro, que tiene un costo recurrente de 19,99 USD por mes. Sin embargo, usuarios corporativos y desarrolladores señalan que las cuotas de consumo iniciales están bastante limitadas, con informes frecuentes de que la generación de solo 2 a 4 videos complejos puede agotar toda la capacidad diaria disponible del plan Pro, generando periodos de restricción de hasta 5 horas en el acceso para el procesamiento de nuevos medios. Para producciones cinematográficas a gran escala, Google ha puesto a disposición el plan Ultra por 249,99 USD mensuales, otorgando una cuota expandida que contiene entre 200 y 25,000 créditos de uso en el entorno Flow.

Compartir

Este contenido fue creado y revisado por nuestro equipo (iatoskill.com), si encuentras algún problema, ponte en contacto con nosotros

¿Fue útil este contenido?
Aprende

Más Noticias

Ver Todo