Google svela Gemini 3.5 Flash con focus su velocità e prezzo triplicato

Martedì 19 maggio 2026 (UTC), il gigante tecnologico Google ha subito una fuga di notizie riguardante il suo nuovo modello di intelligenza artificiale, poche ore prima dell'apertura dell'evento annuale Google I/O 2026 a Mountain View. Lo sviluppatore indipendente pankajkumar_dev ha rivelato che l'azienda lancerà il Gemini 3.5 Flash (identificato internamente come gemini-3.5-flash), un modello ottimizzato per la produzione in tempo reale che dà priorità alla velocità di esecuzione rispetto alla pura riduzione dei costi.
Compromesso tra Prezzo e Prestazioni Ultraveloci
Contrariamente alla recente tendenza del settore di ridurre i costi per token, la nuova scommessa di Google aumenta i valori di calcolo per fornire risposte in tempi di esecuzione record. Secondo le tabelle di prezzi pubblicate dallo sviluppatore ayushrajgorar, il costo di ingresso (input) per milione di token è salito a $1,50, rappresentando un aumento di tre volte rispetto al prezzo del tradizionale Gemini 3 Flash, che è di $0,50. La tariffa di uscita (output) è fissata a $9,00 per milione di token, rispetto ai $3,00 del modello di generazione precedente.
In pratica, il mercato ottiene alternative per diverse esigenze aziendali. Per i sistemi che funzionano in background e tollerano ritardi, il livello Flex riduce i costi di ingresso a $0,75. D'altra parte, per le applicazioni industriali che dipendono da risposte istantanee, il livello Priority addebita $2,70 per l'input per milione di token per garantire il minor tempo di attesa possibile nel processo.
Infrastruttura Ottimizzata e Latenza Inferiore a 200 ms
I test interni dei console mostrano che il nuovo modello raggiunge una latenza di risposta inferiore a 200 millisecondi in query di produzione standardizzate. Questo progresso tecnico è stato ottenuto attraverso la combinazione di distillazione robusta di modelli più grandi e architetture hardware sparse (sparsity). Il modello presenta anche capacità di ragionamento logico simili a quelle del Gemini 3.1 Pro, oltre a sistemi migliorati di verifica e ricerca (grounding) per ridurre significativamente l'occorrenza di risposte imprecise o allucinazioni.
Molti programmatori nella comunità discutono sui social network X se il costo più elevato sarà compensato dalla stabilità operativa. Si prevede che l'annuncio ufficiale e l'apertura delle chiavi pubbliche API avverranno durante la presentazione principale del Google I/O, prevista per oggi alle 17:00 UTC sul sito ufficiale io.google.
Questo contenuto è stato creato e revisionato dal nostro team (iatoskill.com), se riscontri problemi, contattaci


