Google anuncia oficialmente o Gemini 3.5 Flash no Google I/O 2026

Uma foto de plano fechado e amadora de uma mesa de trabalho organizada com dois monitores mostrando métricas de desempenho em tempo real e um tablet transmitindo o keynote do Google I/O.

Nesta terça-feira, 19 de maio de 2026, a gigante de tecnologia Google anunciou oficialmente o lançamento global do seu novo modelo de inteligência artificial de alta velocidade, o Gemini 3.5 Flash, durante a conferência de abertura do Google I/O 2026, realizada em Mountain View. A novidade foi apresentada como a principal aposta da empresa para desenvolvedores que exigem alto desempenho e tempo de resposta extremamente baixo em produção. O novo modelo já está disponível a partir de hoje para testes e integração comercial nas plataformas Google AI Studio e Vertex AI.

Durante o evento, o diretor executivo da Google, Sundar Pichai, destacou o posicionamento estratégico do modelo:

“Com o Gemini 3.5 Flash, estamos entregando velocidade excepcional de processamento sem abrir mão da inteligência profunda que os desenvolvedores esperam da nossa família de modelos. É a nossa resposta definitiva para a necessidade de aplicações em tempo real com escala massiva e custos extremamente competitivos na nuvem.”

Benchmarks de Performance e Latência Sub-200ms

Diferente das abordagens anteriores que focavam puramente na redução extrema do custo por token às custas da qualidade cognitiva, a divisão Google DeepMind refinou a arquitetura do Gemini 3.5 Flash com base em novos algoritmos de destilação de conhecimento. Sob a supervisão de Demis Hassabis, cofundador da Google DeepMind, o modelo alcançou uma latência de processamento em produção consistentemente abaixo de 200 milissegundos na maioria das requisições complexas de texto e visão computacional. Isso posiciona o modelo como uma solução altamente competitiva contra alternativas rápidas do mercado, como o Claude 3.5 Haiku.

Além da velocidade bruta de resposta, a novidade traz uma das maiores capacidades operacionais de sua categoria, mantendo a janela de contexto de 1 milhão de tokens. Essa capacidade permite que o sistema processe grandes volumes de documentos, códigos de programação inteiros e até mesmo horas de vídeo de uma só vez, retornando respostas estruturadas de forma quase instantânea.

Estrutura de Preços e Disponibilidade no Mercado

O anúncio oficial confirmou as taxas para o nível de serviço padrão. O custo de operação foi fixado em US$ 1.50 por milhão de tokens de entrada (input) e US$ 0.60 por milhão de tokens de saída (output), o que o posiciona como uma opção premium e robusta para implantação em sistemas corporativos críticos de atendimento, análise financeira automatizada e processamento dinâmico de dados em tempo real. A infraestrutura de nuvem da Google Cloud já está operando com suporte total ao novo modelo em todas as regiões globais a partir deste keynote.

Compartilhe

Este conteúdo foi criado e revisado por nossa equipe (iatoskill.com), se encontrar algum problema, entre em contato conosco

Este conteúdo foi útil?
Aprenda

Mais Notícias

Ver Tudo