Gemini 3.5 Flash: il modello “economico” di Google che costa più di tutti

16 Giugno 2026

Indice

La classifica che Google non ha messo in copertina
Il paradosso del Flash più caro di tutti
Dov’è che Gemini 3.5 Flash eccelle davvero
Il vibe coding e il conto che arriva
Come leggere questi numeri senza farsi prendere dal panico
E quindi, che fare?
Domande frequenti su Android Bench

Presentare un modello come “veloce, economico e più potente del predecessore” è una mossa classica di marketing. Il problema sorge quando i benchmark ufficiali, quelli pubblicati da Google stessa, smontano la narrativa pezzo per pezzo.

Gemini 3.5 Flash è il modello AI lanciato da Google al Google I/O 2026 il 19 maggio 2026. Si posiziona come strumento di fascia media avanzata, con prezzi di listino di $1,50 per milione di token in input e $9 in output, una finestra di contesto da 1 milione di token e la promessa dichiarata di prestazioni da modello Pro a velocità Flash.

Sul sito ufficiale Google parla di output generato fino a quattro volte più veloce dei modelli concorrenti alla stessa fascia, e di superiorità su Gemini 3.1 Pro su undici benchmark su quindici. Tutto vero, plausibile, verificabile.

Poi arriva Android Bench.

La classifica che Google non ha messo in copertina

Google ha aggiornato i propri ranking Android Bench introducendo per la prima volta Gemini 3.5 Flash nella valutazione, ma il nuovo modello non è riuscito a entrare nei primi cinque posti.

In cima alla classifica si trova OpenAI GPT 5.5 con un punteggio di 74, seguito da GPT 5.4 e Gemini 3.1 Pro Preview entrambi a 72,4. Sì, il modello “precedente” che Gemini 3.5 Flash avrebbe dovuto seppellire.

Al quarto e quinto posto si trovano Claude Opus 4.7 (68,7) e Claude Opus 4.6 (66,6). Gemini 3.5 Flash chiude il gruppo con 63,7 punti, in sesta posizione.

Ecco la classifica completa:

Modello	Punteggio	Latenza media	Token medi	Costo medio
GPT 5.5	74	15,7	64,7	$134,2
GPT 5.4	72,4	21,2	64,2	$91,7
Gemini 3.1 Pro Preview	72,4	11,1	73,3	$47,9
Claude Opus 4.7	68,7	11,6	90,0	$124,3
Claude Opus 4.6	66,6	9,9	69,5	$84,4
Gemini 3.5 Flash	63,7	14,2	355,9	$147,1
GLM 5.1	59,7	33,4	80,2	$46,7
Kimi K2.6	58,6	29,9	94,3	$42,5
Claude Sonnet 4.6	58,4	8,2	47,9	$40,4
DeepSeek V4 Pro	55,4	35,8	132,7	$13,7
Claude Sonnet 4.5	53,7	13,1	94,2	$61,0

Il paradosso del Flash più caro di tutti

Qui arriviamo al punto davvero curioso. Il “Flash” nella denominazione Google ha sempre significato una cosa sola: veloce ed economico. È il tier intermedio, quello che consente di accedere a capacità avanzate senza pagare il prezzo pieno dei modelli Pro.

Questa è la promessa che Google ha costruito nel tempo, ed è quella su cui si fonda la scelta di molti sviluppatori.

Il modello è stato presentato come alternativa più economica e rapida a Gemini 3.1 Pro, con un gap di prestazioni atteso del 6,1%. I risultati del benchmark raccontano invece una storia diversa per lo sviluppo Android: Gemini 3.5 Flash mostra una latenza superiore e un gap di prestazioni del 9% rispetto al predecessore.

Il dato più significativo riguarda il consumo: una media di 355,9 token a esecuzione a $147,1 per benchmark, contro i 73,3 token e circa un terzo del costo di Gemini 3.1 Pro Preview.

Per capire quanto sia anomalo quel dato di 355,9 token medi, basta guardare gli altri: GPT 5.5 ne consuma 64,7, Gemini 3.1 Pro Preview 73,3, persino Claude Opus 4.7, modello di livello superiore, si ferma a 90.

Il marchio Flash è sempre stato sinonimo di velocità e prezzi contenuti, ma i test sullo sviluppo Android hanno rivelato un consumo di risorse fuori scala.

Il risultato finale è che Gemini 3.5 Flash diventa il modello più costoso dell’intera classifica, battendo persino GPT 5.5, che pur ottenendo il punteggio più alto si ferma a $134,2.

Dov’è che Gemini 3.5 Flash eccelle davvero

Sarebbe disonesto fermarsi qui. Nei benchmark pubblicati da Google, Gemini 3.5 Flash supera Gemini 3.1 Pro su Terminal-Bench 2.1 (76,2% contro 70,3%), MCP Atlas (83,6% contro 78,2%), Finance Agent v2 (57,9% contro 43,0%) e GDPval-AA Elo (1656 contro 1314).

Rimane invece sotto a Gemini 3.1 Pro su Humanity’s Last Exam, ARC-AGI-2 e sul test di contesto lungo 128K MRCR v2, quindi non è una sostituzione netta del modello Pro.

Il modello è pensato soprattutto per workflow agentici e task di coding autonomo, dove la capacità di muoversi in ambienti complessi e di ragionare su più passaggi è più importante della conoscenza enciclopedica. Su questo tipo di attività le sue prestazioni sono genuinamente superiori alla generazione precedente.

Il problema specifico emerge quando il compito è scrivere codice Android: un dominio con regole precise, API particolari e pattern consolidati che evidentemente richiedono qualcosa di diverso rispetto al ragionamento multi-step generico.

Il vibe coding e il conto che arriva

C’è un contesto più ampio in cui leggere questi risultati. La comunità degli sviluppatori si sta muovendo sempre più verso il cosiddetto “vibe coding”, la pratica di delegare porzioni significative dello sviluppo software ad agenti AI automatici. Gemini 3.5 Flash generalmente eccelle nei workflow agentici generali, ma lo sviluppo di applicazioni Android specifiche sembra essere il suo punto debole.

Per uno sviluppatore che usa un agente AI per scrivere codice Android tutto il giorno, la differenza di costo tra $47,9(Gemini 3.1 Pro Preview) e $147,1 (Gemini 3.5 Flash) per ogni ciclo di benchmark non è un’astrattezza statistica. È una voce di costo reale, che triplica senza offrire prestazioni superiori.

Come leggere questi numeri senza farsi prendere dal panico

Un’avvertenza è d’obbligo. Google aggiorna questi ranking regolarmente con l’arrivo di nuovi modelli propri e della concorrenza, e i numeri potrebbero migliorare con ulteriori ottimizzazioni al sistema o con l’arrivo del previsto Gemini 3.5 Pro.

Inoltre, in classifiche più generaliste Gemini 3.5 Flash si posiziona comunque nella fascia alta, con un punteggio complessivo di 86/100 su BenchLM.ai che lo colloca al 14° posto su 123 modelli. Il suo punto di forza principale è la categoria Agentic, dove raggiunge il 5° posto globale.

La lettura corretta è quindi questa: Gemini 3.5 Flash è un buon modello per workflow agentici generali. Non è il modello giusto, oggi, se scrivi applicazioni Android e vuoi un rapporto decente tra risultati e costo.

E quindi, che fare?

Google ha costruito una narrativa attorno a Gemini 3.5 Flash fondata su benchmark generali in cui il modello effettivamente si comporta bene. Il problema è che i benchmark generali non sono l’unica misura che conta, e Android Bench dimostra esattamente questo.

Per sviluppatori che lavorano su app Android, la scelta razionale al momento è un’altra: Gemini 3.1 Pro Previewoffre prestazioni superiori del 9% a un terzo del costo, oppure si guarda altrove, dove Claude Opus 4.7 e GPT 5.5 guidano la classifica con numeri nettamente più alti.

Il brand Flash nasce con una promessa di efficienza. Su quel terreno specifico, su questo benchmark specifico, Gemini 3.5 Flash non la mantiene.

Domande frequenti su Android Bench

Cos’è Android Bench?
È la classifica ufficiale pubblicata da Google per valutare le capacità dei modelli AI nei task di sviluppo Android. Confronta diversi modelli su punteggio, latenza, consumo di token e costo medio per esecuzione.

In quale posizione si trova Gemini 3.5 Flash nell’Android Bench?
Al sesto posto su undici modelli testati, con un punteggio di 63,7. Sopra di lui si trovano GPT 5.5, GPT 5.4, Gemini 3.1 Pro Preview, Claude Opus 4.7 e Claude Opus 4.6.

Perché Gemini 3.5 Flash costa così tanto nell’Android Bench?
Perché utilizza in media 355,9 token per ogni esecuzione del benchmark, un valore circa cinque volte superiore rispetto ai modelli concorrenti. Questo porta il costo medio a $147,1 per esecuzione, il più alto dell’intera classifica.

Gemini 3.5 Flash è inutile?
No. Eccelle nei benchmark agentici generali, nel coding autonomo multi-step e nei workflow complessi. Il problema è specificamente lo sviluppo Android, dove le sue prestazioni attuali non giustificano il costo.

Qual è l’alternativa migliore per sviluppatori Android?
In base all’attuale Android Bench, Gemini 3.1 Pro Preview offre prestazioni superiori del 9% a circa un terzo del costo. GPT 5.5 guida la classifica generale, ma con un costo alto. Claude Sonnet 4.6 offre il miglior rapporto costo/efficienza a $40,4 per benchmark.

Quando arriverà Gemini 3.5 Pro?
Google ha anticipato il lancio di Gemini 3.5 Pro per giugno 2026. Potrebbe cambiare significativamente le posizioni in classifica.

Banner di Mistergadget con invito ad aggiungere il sito alle Fonti Preferite di Google

Tag: