Gemini 3.5 Flash: prezzi, benchmark e come usarlo

Al Google I/O del 19 maggio 2026, tra i tanti annunci, quello destinato a entrare subito nel lavoro quotidiano di sviluppatori e aziende è Gemini 3.5 Flash. Non è il modello più grande di Google, ma è quello pensato per essere usato ovunque: veloce, economico, multimodale e ottimizzato per i compiti agentici. Google lo ha portato direttamente in disponibilità generale, saltando la consueta fase di anteprima, e ha dichiarato di volerlo usare come motore per una larga parte dei propri prodotti.

Cosa offre Gemini 3.5 Flash

L'identificativo del modello è gemini-3.5-flash. Accetta in ingresso testo, immagini, video, audio e PDF, e dispone di una finestra di contesto da un milione di token (1.048.576 in ingresso, fino a 65.536 in uscita), sufficiente a far leggere al modello interi libri, basi di codice o lunghi documenti in una sola richiesta. La data di addestramento si ferma a gennaio 2025.

Sul piano delle prestazioni, Google sostiene che 3.5 Flash superi il precedente Gemini 3.1 Pro su benchmark di programmazione, uso di strumenti e capacità multimodali, pur restando molto più rapido: l'azienda parla di una velocità di generazione fino a quattro volte superiore rispetto ai modelli di frontiera. Su Terminal-Bench 2.1, un test che misura la capacità di portare a termine compiti reali da riga di comando, il modello ottiene un punteggio del 76,2%. Una particolarità: 3.5 Flash introduce livelli di ragionamento regolabili (minimo, basso, medio, alto), con impostazione predefinita su medio, così da bilanciare qualità, velocità e costo.

Gemini 3.5 Flash gestisce testo, immagini, audio, video e PDF nello stesso contesto.

Quanto costa

I prezzi dell'API sono di 1,50 dollari per milione di token in ingresso e 9 dollari per milione di token in uscita. È una tariffa più alta rispetto alla precedente anteprima di Gemini 3 Flash (circa tre volte) e molto superiore al modello più leggero Flash-Lite, ma resta competitiva se confrontata con i modelli di pari livello dei concorrenti: secondo diverse analisi, 3.5 Flash si avvicina alle prestazioni di modelli di punta come quelli di Anthropic a una frazione del prezzo. Per chi sviluppa applicazioni che fanno molte chiamate, la combinazione di velocità, contesto ampio e costo contenuto è il vero punto di forza.

Come provarlo subito, gratis e a pagamento

Ci sono tre modi rapidi per metterci le mani:

App Gemini e Ricerca Google: il modello alimenta l'app Gemini e la modalità IA della Ricerca. È il modo più semplice per provarlo senza scrivere codice.
Google AI Studio: la console gratuita di Google per sviluppatori (all'indirizzo aistudio.google.com) permette di chattare con il modello, regolare i parametri e generare la chiamata API pronta da copiare. Il piano gratuito ha limiti di frequenza, sufficienti per i test.
API Gemini: per integrarlo in un'applicazione, si usa la libreria ufficiale.

Ecco un esempio minimo in Python con l'SDK ufficiale google-genai. Prima si installa la libreria e si imposta la chiave ottenuta da AI Studio:

pip install google-genai
export GEMINI_API_KEY="la-tua-chiave"

Poi bastano poche righe per inviare una richiesta:

from google import genai

client = genai.Client()  # legge GEMINI_API_KEY dall'ambiente

risposta = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Riassumi in 5 punti i vantaggi del calcolo fotonico per l'IA."
)
print(risposta.text)

Il risultato atteso è un elenco puntato di cinque vantaggi, generato in genere in un paio di secondi. Per analizzare un documento lungo si può passare un PDF tra i contents sfruttando il contesto da un milione di token, mentre per i compiti agentici si possono collegare strumenti esterni tramite il function calling.

Dove conviene usarlo (e dove no)

Gemini 3.5 Flash è la scelta giusta quando servono velocità e volumi elevati: assistenti, classificazione di testi, estrazione di dati da documenti, agenti che eseguono molti passaggi. Per gli sviluppatori, è disponibile anche dentro Google Antigravity, la piattaforma di sviluppo agentico, e nella Gemini Enterprise Agent Platform. Va però ricordato un limite: il modello non supporta il controllo del computer (la capacità di pilotare interfacce grafiche), funzione riservata ad altri modelli della famiglia. Per i compiti di ragionamento più complessi e di lunga durata, Google rimanda al fratello maggiore Gemini 3.5 Pro, atteso nelle settimane successive. Per tutto il resto, Flash è pensato per diventare il cavallo di battaglia quotidiano.