Al Google I/O del 19 maggio, tra i tanti annunci, ce n'è uno destinato a finire nel lavoro quotidiano di milioni di persone e sviluppatori: Gemini 3.5 Flash. È il nuovo modello "leggero" di Google, pensato per offrire un'intelligenza vicina a quella dei modelli di punta a una frazione del costo, ed è già disponibile in versione stabile (general availability) su tutti i canali principali.
La promessa di Google è chiara: usare Gemini 3.5 Flash come motore predefinito "per quasi tutto", dall'app Gemini alle modalità IA della Ricerca, fino alle integrazioni aziendali. Vediamo cos'è, quanto costa e come provarlo davvero.
Cosa offre Gemini 3.5 Flash
Il modello è ottimizzato per la programmazione e per i flussi "agentici" che eseguono più passaggi in parallelo. Accetta testo, immagini, audio, video e PDF in ingresso e dispone di una finestra di contesto fino a 1 milione di token: in pratica può "leggere" libri interi, lunghe trascrizioni o grandi basi di codice in una singola richiesta. Supporta function calling, output strutturato in JSON, ricerca come strumento ed esecuzione di codice.
Secondo i dati diffusi da Google, su diversi benchmark di coding e compiti agentici la nuova Flash supera persino la precedente generazione Pro, pur restando molto più economica e veloce. È il classico caso in cui il modello "intermedio" diventa la scelta più sensata per la maggior parte degli usi reali.
Quanto costa e cosa è gratis
Sul piano dei prezzi via API, Gemini 3.5 Flash parte da 1,50 dollari per milione di token in ingresso e 9 dollari per milione in uscita; i token in ingresso serviti dalla cache costano 0,15 dollari per milione, un forte risparmio per chi riusa lo stesso contesto. Nelle regioni non globali il prezzo sale leggermente (1,65/9,90 dollari).
Per chi non programma, il modello è raggiungibile gratuitamente attraverso l'app e il sito di Gemini e tramite le funzioni IA della Ricerca Google, con i limiti d'uso dei piani gratuiti. Chi sviluppa può iniziare senza spendere grazie al piano free di Google AI Studio, soggetto a limiti di frequenza delle richieste, e passare poi al piano a consumo quando serve più volume.
Come provarlo subito (app e AI Studio)
La via più rapida senza scrivere codice: aprire l'app Gemini o il sito, e verificare di avere selezionato il modello più recente nel menù dei modelli. In alternativa, su aistudio.google.com si può chattare con Gemini 3.5 Flash, caricare immagini o PDF e regolare i parametri, ottenendo gratuitamente una chiave API per i propri progetti.
Un esempio di prompt da incollare per testarne la sintesi su un documento lungo:
Agisci come analista. Ti incollo il testo di un bando pubblico. Estrai in una tabella: requisiti di partecipazione, scadenze, importo del finanziamento e documenti richiesti. Segnala in fondo eventuali punti ambigui da verificare. Ecco il testo: [incolla qui]
Un esempio via API in Python
Per gli sviluppatori, con il nuovo SDK ufficiale bastano poche righe. Prima si installa il pacchetto:
pip install -q -U google-genai
Poi si effettua una chiamata, indicando l'identificativo esatto del modello, gemini-3.5-flash:
from google import genai
client = genai.Client(api_key="LA_TUA_API_KEY")
resp = client.models.generate_content(
model="gemini-3.5-flash",
contents="Riassumi in 3 punti i vantaggi di un modello a contesto lungo"
)
print(resp.text)
Il risultato atteso è un breve elenco puntato, prodotto in genere in meno di un secondo. Da qui si può aggiungere lo streaming della risposta, allegare immagini o file e chiedere output in formato JSON: tutti aspetti che approfondiamo nella nostra guida dedicata all'uso delle API di Gemini in Python.
Gemini 3.5 Flash conviene? A chi si rivolge
Per la maggior parte delle attività — riassunti, traduzioni, bozze, estrazione dati, assistenza al codice — Gemini 3.5 Flash è oggi una delle opzioni con il miglior rapporto tra qualità, velocità e costo. Chi lavora su problemi molto complessi di ragionamento o coding di frontiera può ancora preferire i modelli "Pro" o le alternative di OpenAI e Anthropic, ma per il lavoro di tutti i giorni la nuova Flash è un'ottima scelta predefinita, soprattutto per chi deve elaborare documenti molto lunghi.




