La corsa ai modelli di punta non perdona i ritardi, ma a volte rallentare e' la scelta meno rischiosa. Google ha posticipato in modo discreto la disponibilita' generale di Gemini 3.5 Pro, il modello di vertice che avrebbe dovuto debuttare entro giugno 2026 e che invece e' slittato a luglio. La motivazione, secondo le ricostruzioni di settore emerse il 26 giugno, riguarda due aspetti specifici segnalati dai tester della fase di anteprima: l'efficienza nell'uso dei token e le prestazioni nei compiti a lungo orizzonte temporale.

Gemini 3.5 Pro doveva arrivare a giugno: ora se ne parla a luglio. Immagine: Pexels.

Cosa avrebbe dovuto portare Gemini 3.5 Pro

Gemini 3.5 Pro e' atteso come l'evoluzione della linea Pro di Google, quella destinata ai compiti piu' complessi di ragionamento, programmazione e analisi su grandi quantita' di dati. Il modello dovrebbe rappresentare la risposta diretta ai concorrenti di fascia alta, in un momento in cui OpenAI ha appena presentato la system card di GPT-5.6 e Anthropic continua a guadagnare terreno tra gli utenti paganti. In questo scenario, ogni settimana di ritardo pesa sul piano dell'immagine.

I due nodi segnalati non sono dettagli. L'efficienza dei token incide direttamente sui costi: un modello che consuma piu' token del necessario per arrivare alla stessa risposta e' piu' caro da usare, sia per Google sia per gli sviluppatori che lo integrano. Le prestazioni nei compiti a lungo orizzonte — quelli in cui il modello deve mantenere coerenza e direzione attraverso molti passaggi, come negli agenti autonomi — sono invece il vero campo di battaglia del 2026: e' qui che si gioca la differenza tra un chatbot che risponde bene e un sistema capace di portare a termine progetti complessi.

Un rinvio "silenzioso", letto dai mercati di previsione

La particolarita' di questa vicenda e' che Google non ha annunciato il ritardo con un comunicato ufficiale: lo slittamento e' emerso da indiscrezioni e dall'osservazione dei mercati di previsione, dove la probabilita' di un lancio entro fine giugno e' crollata a percentuali minime. E' un metodo sempre piu' comune per leggere le mosse delle aziende tecnologiche quando queste preferiscono non comunicare apertamente i propri inciampi.

Per Google si tratta di una scelta comprensibile: presentare un modello di punta con problemi noti di efficienza o di tenuta sui compiti lunghi avrebbe rischiato di esporlo a confronti impietosi con i rivali, in un mercato dove i benchmark vengono replicati e commentati in poche ore. Meglio, dal suo punto di vista, ritardare di qualche settimana e arrivare con un prodotto piu' rifinito.

Il ritardo e' emerso da indiscrezioni e mercati di previsione, non da un annuncio ufficiale. Immagine: Pexels.

Cosa cambia per chi usa Gemini

Nell'immediato, per gli utenti dell'app Gemini e per gli sviluppatori che lavorano con le API di Google cambia poco: i modelli gia' disponibili, dalla linea Gemini 3 alle varianti Flash piu' veloci ed economiche, restano operativi. Chi aspettava 3.5 Pro per progetti specifici — soprattutto applicazioni agentiche o flussi che richiedono lunghe sequenze di passaggi — dovra' semplicemente pazientare qualche settimana in piu'.

Il rinvio racconta pero' una tendenza piu' ampia. Dopo anni di lanci a ritmo serrato, i grandi laboratori iniziano a scontrarsi con la difficolta' di spremere ulteriori miglioramenti dai modelli senza farne lievitare i costi o senza introdurre comportamenti indesiderati. Lo stesso OpenAI, nella system card di GPT-5.6, ha ammesso una maggiore tendenza dei nuovi modelli ad andare oltre le istruzioni. La fase in cui bastava "scalare" per migliorare sembra lasciare spazio a una piu' faticosa opera di rifinitura, dove anche un colosso come Google preferisce prendersi qualche giorno in piu' pur di non sbagliare il debutto.