Gemini 3.5 Flash Low: meno token per Antigravity
Google sta attraversando un momento un po’ imbarazzante con Gemini e i limiti di utilizzo: prima ha ridotto silenziosamente le quote del piano AI Pro, poi ha aumentato i limiti di Antigravity per due volte di fila, e ora lancia un modello apposito per consumare meno token. Come abbiamo già raccontato, la situazione non è mai stata del tutto sotto controllo.
La novità si chiama Gemini 3.5 Flash (Low) ed è pensata specificamente per chi usa Antigravity, la piattaforma di sviluppo software di Google basata sull’AI. Il problema di fondo era semplice: anche le operazioni banali consumavano una quantità spropositata di token, bruciando in fretta le quote disponibili.
Vuoi ascoltare il riassunto dell’articolo?
Varun Mohan, Director di Google DeepMind sul progetto Antigravity, ha riconosciuto pubblicamente le lamentele degli utenti. La sua spiegazione è che il team ha ottimizzato Gemini 3.5 Flash per i compiti complessi, finendo per trascurare la misurazione del consumo di token su quelli semplici: un punto cieco che ha colpito proprio chi usava il modello per attività di routine nel coding.
Il nuovo modello Low genera circa il 45% di token in meno rispetto alla variante originale, che nel frattempo è stata rinominata Gemini 3.5 Flash (Medium). Mohan precisa che la variante Low riduce il livello di impegno del modello senza tagliare scorciatoie sul prompt di sistema o sulla compattazione del contesto: in pratica, fa meno fatica dove non serve farne tanta.
Stando alle dichiarazioni di Google, il nuovo Low supera generalmente il vecchio Gemini 3 Flash (ora chiamato variante “High”) sui compiti di ingegneria del software. Un utente ha chiesto a Mohan se Google avesse fatto dei test prima del lancio, visto che sembra stia sperimentando direttamente sugli utenti. La risposta è stata che il team usa il modello internamente da un po’, ma l’ammissione del punto cieco sui task semplici dice tutto.
In parallelo al lancio del nuovo modello, Google ha azzerato le quote Gemini su tutti i piani, gratuiti e a pagamento, per garantire che gli utenti abbiano token sufficienti per il lavoro di sviluppo software questa settimana.
Vale la pena sottolineare che Gemini 3.5 Flash (Low) è pensato per Antigravity e strumenti di sviluppo, non per l’app Gemini che usiamo quotidianamente. Chi non tocca codice con questi strumenti difficilmente se ne accorgerà. Detto questo, la vicenda racconta qualcosa di più ampio: Google sta ancora cercando l’equilibrio tra qualità del modello, consumi e quote, e lo sta facendo in pubblico, con aggiustamenti in corsa che non trasmettono esattamente fiducia nella pianificazione iniziale.
E non crediate che nelle altre AI le situazione sia tanto migliore: sono mesi che su Reddit è pieno di lamentele per le quote d’uso di Claude, e la situazione non accenna a migliorare. Mal comune mezzo gaudio?
Source link





