Al Google I/O del 19 maggio 2026, tra i tanti annunci, quello destinato a entrare subito nel lavoro quotidiano di sviluppatori e aziende è Gemini 3.5 Flash. Non è il modello più grande di Google, ma è quello pensato per essere usato ovunque: veloce, economico, multimodale e ottimizzato per i compiti agentici. Google lo ha portato direttamente in disponibilità generale, saltando la consueta fase di anteprima, e ha dichiarato di volerlo usare come motore per una larga parte dei propri prodotti.
Cosa offre Gemini 3.5 Flash
L'identificativo del modello è gemini-3.5-flash. Accetta in ingresso testo, immagini, video, audio e PDF, e dispone di una finestra di contesto da un milione di token (1.048.576 in ingresso, fino a 65.536 in uscita), sufficiente a far leggere al modello interi libri, basi di codice o lunghi documenti in una sola richiesta. La data di addestramento si ferma a gennaio 2025.
Sul piano delle prestazioni, Google sostiene che 3.5 Flash superi il precedente Gemini 3.1 Pro su benchmark di programmazione, uso di strumenti e capacità multimodali, pur restando molto più rapido: l'azienda parla di una velocità di generazione fino a quattro volte superiore rispetto ai modelli di frontiera. Su Terminal-Bench 2.1, un test che misura la capacità di portare a termine compiti reali da riga di comando, il modello ottiene un punteggio del 76,2%. Una particolarità: 3.5 Flash introduce livelli di ragionamento regolabili (minimo, basso, medio, alto), con impostazione predefinita su medio, così da bilanciare qualità, velocità e costo.
Quanto costa
I prezzi dell'API sono di 1,50 dollari per milione di token in ingresso e 9 dollari per milione di token in uscita. È una tariffa più alta rispetto alla precedente anteprima di Gemini 3 Flash (circa tre volte) e molto superiore al modello più leggero Flash-Lite, ma resta competitiva se confrontata con i modelli di pari livello dei concorrenti: secondo diverse analisi, 3.5 Flash si avvicina alle prestazioni di modelli di punta come quelli di Anthropic a una frazione del prezzo. Per chi sviluppa applicazioni che fanno molte chiamate, la combinazione di velocità, contesto ampio e costo contenuto è il vero punto di forza.
Come provarlo subito, gratis e a pagamento
Ci sono tre modi rapidi per metterci le mani:
- App Gemini e Ricerca Google: il modello alimenta l'app Gemini e la modalità IA della Ricerca. È il modo più semplice per provarlo senza scrivere codice.
- Google AI Studio: la console gratuita di Google per sviluppatori (all'indirizzo aistudio.google.com) permette di chattare con il modello, regolare i parametri e generare la chiamata API pronta da copiare. Il piano gratuito ha limiti di frequenza, sufficienti per i test.
- API Gemini: per integrarlo in un'applicazione, si usa la libreria ufficiale.
Ecco un esempio minimo in Python con l'SDK ufficiale google-genai. Prima si installa la libreria e si imposta la chiave ottenuta da AI Studio:
pip install google-genai
export GEMINI_API_KEY="la-tua-chiave"
Poi bastano poche righe per inviare una richiesta:
from google import genai
client = genai.Client() # legge GEMINI_API_KEY dall'ambiente
risposta = client.models.generate_content(
model="gemini-3.5-flash",
contents="Riassumi in 5 punti i vantaggi del calcolo fotonico per l'IA."
)
print(risposta.text)
Il risultato atteso è un elenco puntato di cinque vantaggi, generato in genere in un paio di secondi. Per analizzare un documento lungo si può passare un PDF tra i contents sfruttando il contesto da un milione di token, mentre per i compiti agentici si possono collegare strumenti esterni tramite il function calling.
Dove conviene usarlo (e dove no)
Gemini 3.5 Flash è la scelta giusta quando servono velocità e volumi elevati: assistenti, classificazione di testi, estrazione di dati da documenti, agenti che eseguono molti passaggi. Per gli sviluppatori, è disponibile anche dentro Google Antigravity, la piattaforma di sviluppo agentico, e nella Gemini Enterprise Agent Platform. Va però ricordato un limite: il modello non supporta il controllo del computer (la capacità di pilotare interfacce grafiche), funzione riservata ad altri modelli della famiglia. Per i compiti di ragionamento più complessi e di lunga durata, Google rimanda al fratello maggiore Gemini 3.5 Pro, atteso nelle settimane successive. Per tutto il resto, Flash è pensato per diventare il cavallo di battaglia quotidiano.




