Google anuncia oficialmente el Gemini 3.5 Flash en Google I/O 2026

2026-05-19T17:37:13.612Z

Una foto de primer plano y amateur de un escritorio organizado con dos monitores mostrando métricas de rendimiento en tiempo real y una tableta transmitiendo el discurso de apertura de Google I/O.

Este martes, 19 de mayo de 2026 (UTC), el gigante tecnológico Google anunció oficialmente el lanzamiento global de su nuevo modelo de inteligencia artificial de alta velocidad, el Gemini 3.5 Flash, durante la conferencia de apertura de Google I/O 2026, celebrada en Mountain View. La novedad fue presentada como la principal apuesta de la empresa para desarrolladores que exigen alto rendimiento y tiempos de respuesta extremadamente bajos en producción. El nuevo modelo ya está disponible desde hoy para pruebas e integración comercial en las plataformas Google AI Studio y Vertex AI.

Durante el evento, el director ejecutivo de Google, Sundar Pichai, destacó la posición estratégica del modelo:

“Con el Gemini 3.5 Flash, estamos entregando una velocidad excepcional de procesamiento sin renunciar a la inteligencia profunda que los desarrolladores esperan de nuestra familia de modelos. Es nuestra respuesta definitiva a la necesidad de aplicaciones en tiempo real con escala masiva y costos extremadamente competitivos en la nube.”

Benchmarks de Rendimiento y Latencia Sub-200ms

A diferencia de los enfoques anteriores que se centraban puramente en la reducción extrema del costo por token a expensas de la calidad cognitiva, la división Google DeepMind refinó la arquitectura del Gemini 3.5 Flash basándose en nuevos algoritmos de destilación de conocimiento. Bajo la supervisión de Demis Hassabis, cofundador de Google DeepMind, el modelo logró una latencia de procesamiento en producción consistentemente por debajo de 200 milisegundos en la mayoría de las solicitudes complejas de texto y visión computacional. Esto posiciona al modelo como una solución altamente competitiva frente a alternativas rápidas del mercado, como el Claude 3.5 Haiku.

Además de la velocidad bruta de respuesta, la novedad ofrece una de las mayores capacidades operativas de su categoría, manteniendo la ventana de contexto de 1 millón de tokens. Esta capacidad permite que el sistema procese grandes volúmenes de documentos, códigos de programación enteros e incluso horas de video de una sola vez, devolviendo respuestas estructuradas de forma casi instantánea.

Estructura de Precios y Disponibilidad en el Mercado

El anuncio oficial confirmó las tarifas para el nivel de servicio estándar. El costo de operación se fijó en US$ 1.50 por millón de tokens de entrada y US$ 0.60 por millón de tokens de salida, lo que lo posiciona como una opción premium y robusta para la implementación en sistemas corporativos críticos de atención, análisis financiero automatizado y procesamiento dinámico de datos en tiempo real. La infraestructura en la nube de Google Cloud ya está operando con soporte total al nuevo modelo en todas las regiones globales a partir de este discurso.

Este contenido fue creado y revisado por nuestro equipo (iatoskill.com), si encuentras algún problema, ponte en contacto con nosotros

¿Fue útil este contenido?

Google anuncia oficialmente el Gemini 3.5 Flash en Google I/O 2026

Benchmarks de Rendimiento y Latencia Sub-200ms

Estructura de Precios y Disponibilidad en el Mercado

Compartir

Más Noticias

Startup Meng Xiaoyi lanza collar de IA que 'traduce' ladridos de mascotas

Casa Blanca cierra acuerdo con Anthropic para uso de IA en la NSA

DeepSeek fija precios del V4-Pro con un descuento permanente del 75%