Nano Banana 2 Lite e Gemini Omni Flash: prezzi e funzioni
Google ha appena rilasciato due nuovi modelli AI per sviluppatori e consumatori: Nano Banana 2 Lite, il modello di generazione immagini più veloce ed economico della famiglia Nano Banana, e Gemini Omni Flash, pensato per la generazione e l’editing di video. Entrambi sono disponibili già oggi su Google AI Studio e tramite le API Gemini, e stanno arrivando anche su superfici consumer come la Ricerca Google, l’app Gemini e altri prodotti Google.
Vuoi ascoltare il riassunto dell’articolo?

Nano Banana 2 Lite: immagini in 4 secondi a costo ridottissimo
Nano Banana 2 Lite (identificato internamente come gemini-3.1-flash-lite-image) è progettato per chi ha bisogno di generare immagini in grandi volumi e con latenza minima. Il dato più rilevante è la velocità: 4 secondi per produrre un’immagine da testo, il che lo rende adatto alla prototipazione rapida e ai flussi di lavoro ad alto ritmo.
Sul fronte dei costi, il prezzo è di 0,034 dollari per 1.000 immagini a risoluzione 1K: un valore pensato per chi deve gestire budget operativi o volumi elevati. Nonostante la priorità alla velocità, Google dichiara che il modello mantiene una buona aderenza ai prompt, coerenza dei personaggi e testo leggibile all’interno delle immagini.
Nano Banana 2 Lite è il sostituto consigliato per chi usava la prima versione di Nano Banana (gemini-2.5-flash-image): secondo Google, uno swap diretto porta benefici immediati su qualità, velocità e costi. Per contestualizzare, la famiglia si articola così:
- Nano Banana 2 Lite: massima velocità, bassa latenza, volumi alti
- Nano Banana 2: bilanciamento tra qualità e costo, uso generale
- Nano Banana Pro: uso professionale complesso, massima precisione
- Nano Banana (legacy): da aggiornare, non più raccomandato
Oltre agli sviluppatori, Nano Banana 2 Lite sta arrivando su AI Mode nella Ricerca, NotebookLM, Google Photos, Stitch, Google Flow e Google Ads.

Gemini Omni Flash: editing video con il linguaggio naturale
Gemini Omni Flash (gemini-omni-flash-preview) era stato annunciato al Google I/O e oggi arriva ufficialmente agli sviluppatori tramite API. Il modello supporta la generazione di video da testo, immagini e video in input, e permette di modificare i filmati tramite istruzioni in linguaggio naturale, il che è la parte più interessante per chi lavora con contenuti multimediali.
Le capacità principali includono:
- Editing conversazionale: si modifica il video descrivendo a parole cosa si vuole cambiare
- Referencing multimodale: si combinano immagini, testo e video per mantenere coerenza visiva
- Conoscenza del mondo reale: il modello attinge alle conoscenze di Gemini per costruire narrative credibili
- Sincronizzazione testo-azione: testi e grafiche si collegano direttamente alle azioni nel video
Il prezzo è di 0,10 dollari al secondo di video generato, in linea con Veo 3.1 Fast.
Ci sono però limitazioni importanti da conoscere: le generazioni sono attualmente limitate a 10 secondi, non è ancora supportato l’upload di riferimenti audio, i video di riferimento fino a 3 secondi vengono accettati dallo schema API ma non elaborati correttamente, e la coerenza dei personaggi nelle transizioni di scena è ancora imprecisa. Google dichiara di stare lavorando su questi punti.
La vera proposta di valore che Google vuole comunicare è la catena tra i due modelli: si genera un’immagine con Nano Banana 2 Lite (veloce ed economico), poi la si passa a Omni Flash per animarla in un video. Tramite l’Interactions API è possibile mantenere la cronologia della sessione e impilare fino a tre modifiche sequenziali. Google ha già pubblicato alcune app demo per mostrare questo workflow: una per teletrasportarsi in luoghi iconici partendo da un selfie, una per il design d’interni, una per creare video di prodotto in stile e-commerce.
Entrambi i modelli usano il watermarking SynthID di Google e il contenuto generato è verificabile tramite l’app Gemini, Gemini in Chrome o la Ricerca.
Una buona notizia sul fronte della trasparenza, anche se resta da vedere quanto questo sistema sarà davvero adottato nella pratica.

Source link





