Google filtra el Gemini 3.5 Flash enfocado en velocidad y precio 3x mayor

Una foto realista y amateur en primer plano de un escritorio de madera de un desarrollador, con un portátil mostrando líneas de código y una taza de café al lado.

Este martes, 19 de mayo de 2026 (UTC), el gigante tecnológico Google sufrió la filtración de detalles confidenciales de su nuevo modelo de inteligencia artificial, pocas horas antes de la apertura del evento anual Google I/O 2026 en Mountain View. El desarrollador independiente pankajkumar_dev reveló que la empresa lanzará el Gemini 3.5 Flash (identificado internamente como gemini-3.5-flash), un modelo optimizado para producción en tiempo real que prioriza la velocidad de ejecución sobre la reducción pura de costos.

Equilibrio entre Precio y Desempeño Ultrarrápido

A diferencia de la reciente tendencia del sector de abaratar costos por token, la nueva apuesta de Google eleva los valores de computación para entregar respuestas en tiempo récord. Según las tablas de precios publicadas por el desarrollador ayushrajgorar, el costo de entrada (input) por millón de tokens subió a US$ 1,50, representando un salto de tres veces el valor cobrado por el Gemini 3 Flash tradicional, que cuesta US$ 0,50. La tarifa de salida (output) se fijó en US$ 9,00 por millón de tokens, en comparación con los US$ 3,00 del modelo de generación anterior.

En la práctica, el mercado gana alternativas para diferentes necesidades empresariales. Para sistemas que operan en segundo plano y toleran retrasos, el nivel Flex reduce los costos de entrada a US$ 0,75. Por otro lado, para aplicaciones industriales que dependen de respuestas instantáneas, el nivel Priority cobra US$ 2,70 en input por millón de tokens para garantizar el menor tiempo de espera posible.

Infraestructura Optimizada y Latencia Inferior a 200ms

Las pruebas de consolas internas muestran que el nuevo modelo alcanza una latencia de respuesta por debajo de 200 milisegundos en consultas estándar de producción. Este avance técnico se logró a través de la combinación de destilación robusta de modelos más grandes y arquitecturas de hardware esparcidas (sparsity). El modelo también presenta capacidades de razonamiento lógico cercanas a las del Gemini 3.1 Pro, además de contar con sistemas mejorados de verificación y búsqueda (grounding) para atenuar considerablemente la ocurrencia de respuestas imprecisas o alucinaciones.

Muchos programadores en la comunidad debaten en la red social X si el costo más elevado se compensará con la estabilidad operativa. Se espera que el anuncio oficial y la apertura de las claves públicas de API ocurran durante la presentación principal del Google I/O, programada para hoy a las 17:00 (UTC) en el sitio oficial io.google.

Compartir

Este contenido fue creado y revisado por nuestro equipo (iatoskill.com), si encuentras algún problema, ponte en contacto con nosotros

¿Fue útil este contenido?
Aprende

Más Noticias

Ver Todo