Google annuncia ufficialmente Gemini 3.5 Flash al Google I/O 2026

Una foto ravvicinata e amatoriale di una scrivania ordinata con due monitor che mostrano metriche di prestazioni in tempo reale e un tablet che trasmette il keynote del Google I/O.

Martedì, 19 maggio 2026 (UTC), il gigante della tecnologia Google ha annunciato ufficialmente il lancio globale del suo nuovo modello di intelligenza artificiale ad alta velocità, il Gemini 3.5 Flash, durante la conferenza di apertura del Google I/O 2026 a Mountain View. La novità è stata presentata come la principale scommessa dell'azienda per gli sviluppatori che richiedono alte prestazioni e tempi di risposta estremamente bassi in produzione. Il nuovo modello è già disponibile da oggi per test e integrazione commerciale sulle piattaforme Google AI Studio e Vertex AI.

Durante l'evento, il CEO di Google, Sundar Pichai, ha sottolineato il posizionamento strategico del modello:

“Con il Gemini 3.5 Flash, stiamo offrendo una velocità eccezionale di elaborazione senza rinunciare all'intelligenza profonda che gli sviluppatori si aspettano dalla nostra famiglia di modelli. È la nostra risposta definitiva alla necessità di applicazioni in tempo reale con scala massiva e costi estremamente competitivi nel cloud.”

Benchmark di prestazioni e latenza sotto i 200ms

A differenza degli approcci precedenti che si concentravano esclusivamente sulla riduzione estrema del costo per token a scapito della qualità cognitiva, la divisione Google DeepMind ha perfezionato l'architettura del Gemini 3.5 Flash basandosi su nuovi algoritmi di distillazione della conoscenza. Sotto la supervisione di Demis Hassabis, cofondatore di Google DeepMind, il modello ha raggiunto una latenza di elaborazione in produzione costantemente inferiore ai 200 millisecondi nella maggior parte delle richieste complesse di testo e visione computazionale. Questo posiziona il modello come una soluzione altamente competitiva contro alternative rapide del mercato, come il Claude 3.5 Haiku.

Oltre alla velocità di risposta, la novità offre una delle maggiori capacità operative della sua categoria, mantenendo la finestra di contesto di 1 milione di token. Questa capacità permette al sistema di elaborare grandi volumi di documenti, interi codici di programmazione e persino ore di video in una sola volta, restituendo risposte strutturate quasi istantaneamente.

Struttura dei prezzi e disponibilità sul mercato

L'annuncio ufficiale ha confermato le tariffe per il livello di servizio standard. Il costo di operazione è stato fissato a 1,50 USD per milione di token di input e 0,60 USD per milione di token di output, il che lo posiziona come un'opzione premium e robusta per l'implementazione in sistemi aziendali critici di assistenza, analisi finanziaria automatizzata e elaborazione dinamica dei dati in tempo reale. L'infrastruttura cloud di Google Cloud è già operativa con supporto completo per il nuovo modello in tutte le regioni globali a partire da questo keynote.

Condividi

Questo contenuto è stato creato e revisionato dal nostro team (iatoskill.com), se riscontri problemi, contattaci

Questo contenuto è stato utile?
Impara

Altre Notizie

Vedi Tutto
Google annuncia ufficialmente Gemini 3.5 Flash al Google I/O 2026