Google annuncia ufficialmente Gemini 3.5 Flash al Google I/O 2026

2026-05-19T17:37:13.612Z

Una foto ravvicinata e amatoriale di una scrivania ordinata con due monitor che mostrano metriche di prestazioni in tempo reale e un tablet che trasmette il keynote del Google I/O.

Martedì, 19 maggio 2026 (UTC), il gigante della tecnologia Google ha annunciato ufficialmente il lancio globale del suo nuovo modello di intelligenza artificiale ad alta velocità, il Gemini 3.5 Flash, durante la conferenza di apertura del Google I/O 2026 a Mountain View. La novità è stata presentata come la principale scommessa dell'azienda per gli sviluppatori che richiedono alte prestazioni e tempi di risposta estremamente bassi in produzione. Il nuovo modello è già disponibile da oggi per test e integrazione commerciale sulle piattaforme Google AI Studio e Vertex AI.

Durante l'evento, il CEO di Google, Sundar Pichai, ha sottolineato il posizionamento strategico del modello:

“Con il Gemini 3.5 Flash, stiamo offrendo una velocità eccezionale di elaborazione senza rinunciare all'intelligenza profonda che gli sviluppatori si aspettano dalla nostra famiglia di modelli. È la nostra risposta definitiva alla necessità di applicazioni in tempo reale con scala massiva e costi estremamente competitivi nel cloud.”

Benchmark di prestazioni e latenza sotto i 200ms

A differenza degli approcci precedenti che si concentravano esclusivamente sulla riduzione estrema del costo per token a scapito della qualità cognitiva, la divisione Google DeepMind ha perfezionato l'architettura del Gemini 3.5 Flash basandosi su nuovi algoritmi di distillazione della conoscenza. Sotto la supervisione di Demis Hassabis, cofondatore di Google DeepMind, il modello ha raggiunto una latenza di elaborazione in produzione costantemente inferiore ai 200 millisecondi nella maggior parte delle richieste complesse di testo e visione computazionale. Questo posiziona il modello come una soluzione altamente competitiva contro alternative rapide del mercato, come il Claude 3.5 Haiku.

Oltre alla velocità di risposta, la novità offre una delle maggiori capacità operative della sua categoria, mantenendo la finestra di contesto di 1 milione di token. Questa capacità permette al sistema di elaborare grandi volumi di documenti, interi codici di programmazione e persino ore di video in una sola volta, restituendo risposte strutturate quasi istantaneamente.

Struttura dei prezzi e disponibilità sul mercato

L'annuncio ufficiale ha confermato le tariffe per il livello di servizio standard. Il costo di operazione è stato fissato a 1,50 USD per milione di token di input e 0,60 USD per milione di token di output, il che lo posiziona come un'opzione premium e robusta per l'implementazione in sistemi aziendali critici di assistenza, analisi finanziaria automatizzata e elaborazione dinamica dei dati in tempo reale. L'infrastruttura cloud di Google Cloud è già operativa con supporto completo per il nuovo modello in tutte le regioni globali a partire da questo keynote.

Questo contenuto è stato creato e revisionato dal nostro team (iatoskill.com), se riscontri problemi, contattaci

Questo contenuto è stato utile?

Google annuncia ufficialmente Gemini 3.5 Flash al Google I/O 2026

Benchmark di prestazioni e latenza sotto i 200ms

Struttura dei prezzi e disponibilità sul mercato

Condividi

Altre Notizie

La startup Meng Xiaoyi lancia un collare IA che 'traduce' i latrati degli animali domestici

La Casa Bianca stipula accordo con Anthropic per l'uso dell'IA alla NSA

DeepSeek fissa i prezzi del V4-Pro con uno sconto permanente del 75%