Google anuncia oficialmente o Gemini 3.5 Flash no Google I/O 2026

2026-05-19T17:37:13.612Z

Uma foto de plano fechado e amadora de uma mesa de trabalho organizada com dois monitores mostrando métricas de desempenho em tempo real e um tablet transmitindo o keynote do Google I/O.

Nesta terça-feira, 19 de maio de 2026, a gigante de tecnologia Google anunciou oficialmente o lançamento global do seu novo modelo de inteligência artificial de alta velocidade, o Gemini 3.5 Flash, durante a conferência de abertura do Google I/O 2026, realizada em Mountain View. A novidade foi apresentada como a principal aposta da empresa para desenvolvedores que exigem alto desempenho e tempo de resposta extremamente baixo em produção. O novo modelo já está disponível a partir de hoje para testes e integração comercial nas plataformas Google AI Studio e Vertex AI.

Durante o evento, o diretor executivo da Google, Sundar Pichai, destacou o posicionamento estratégico do modelo:

“Com o Gemini 3.5 Flash, estamos entregando velocidade excepcional de processamento sem abrir mão da inteligência profunda que os desenvolvedores esperam da nossa família de modelos. É a nossa resposta definitiva para a necessidade de aplicações em tempo real com escala massiva e custos extremamente competitivos na nuvem.”

Benchmarks de Performance e Latência Sub-200ms

Diferente das abordagens anteriores que focavam puramente na redução extrema do custo por token às custas da qualidade cognitiva, a divisão Google DeepMind refinou a arquitetura do Gemini 3.5 Flash com base em novos algoritmos de destilação de conhecimento. Sob a supervisão de Demis Hassabis, cofundador da Google DeepMind, o modelo alcançou uma latência de processamento em produção consistentemente abaixo de 200 milissegundos na maioria das requisições complexas de texto e visão computacional. Isso posiciona o modelo como uma solução altamente competitiva contra alternativas rápidas do mercado, como o Claude 3.5 Haiku.

Além da velocidade bruta de resposta, a novidade traz uma das maiores capacidades operacionais de sua categoria, mantendo a janela de contexto de 1 milhão de tokens. Essa capacidade permite que o sistema processe grandes volumes de documentos, códigos de programação inteiros e até mesmo horas de vídeo de uma só vez, retornando respostas estruturadas de forma quase instantânea.

Estrutura de Preços e Disponibilidade no Mercado

O anúncio oficial confirmou as taxas para o nível de serviço padrão. O custo de operação foi fixado em US$ 1.50 por milhão de tokens de entrada (input) e US$ 0.60 por milhão de tokens de saída (output), o que o posiciona como uma opção premium e robusta para implantação em sistemas corporativos críticos de atendimento, análise financeira automatizada e processamento dinâmico de dados em tempo real. A infraestrutura de nuvem da Google Cloud já está operando com suporte total ao novo modelo em todas as regiões globais a partir deste keynote.

Compartilhe

Este conteúdo foi criado e revisado por nossa equipe (iatoskill.com), se encontrar algum problema, entre em contato conosco

Este conteúdo foi útil?

Google anuncia oficialmente o Gemini 3.5 Flash no Google I/O 2026

Benchmarks de Performance e Latência Sub-200ms

Estrutura de Preços e Disponibilidade no Mercado

Compartilhe

Mais Notícias

Startup Meng Xiaoyi lança colar de IA que 'traduz' latidos de pets

Casa Branca fecha acordo com Anthropic para uso de IA na NSA

DeepSeek fixa preços do V4-Pro com desconto permanente de 75%