Scienza e tecnologia

Nano Banana 2 Lite e Gemini Omni Flash: prezzi e funzioni




Segui Smartworld su Google

Google ha appena rilasciato due nuovi modelli AI per sviluppatori e consumatori: Nano Banana 2 Lite, il modello di generazione immagini più veloce ed economico della famiglia Nano Banana, e Gemini Omni Flash, pensato per la generazione e l’editing di video. Entrambi sono disponibili già oggi su Google AI Studio e tramite le API Gemini, e stanno arrivando anche su superfici consumer come la Ricerca Google, l’app Gemini e altri prodotti Google.

Vuoi ascoltare il riassunto dell’articolo?

Nano Banana 2 Lite: immagini in 4 secondi a costo ridottissimo

Nano Banana 2 Lite (identificato internamente come gemini-3.1-flash-lite-image) è progettato per chi ha bisogno di generare immagini in grandi volumi e con latenza minima. Il dato più rilevante è la velocità: 4 secondi per produrre un’immagine da testo, il che lo rende adatto alla prototipazione rapida e ai flussi di lavoro ad alto ritmo.

Sul fronte dei costi, il prezzo è di 0,034 dollari per 1.000 immagini a risoluzione 1K: un valore pensato per chi deve gestire budget operativi o volumi elevati. Nonostante la priorità alla velocità, Google dichiara che il modello mantiene una buona aderenza ai prompt, coerenza dei personaggi e testo leggibile all’interno delle immagini.

Nano Banana 2 Lite è il sostituto consigliato per chi usava la prima versione di Nano Banana (gemini-2.5-flash-image): secondo Google, uno swap diretto porta benefici immediati su qualità, velocità e costi. Per contestualizzare, la famiglia si articola così:

  • Nano Banana 2 Lite: massima velocità, bassa latenza, volumi alti
  • Nano Banana 2: bilanciamento tra qualità e costo, uso generale
  • Nano Banana Pro: uso professionale complesso, massima precisione
  • Nano Banana (legacy): da aggiornare, non più raccomandato

Oltre agli sviluppatori, Nano Banana 2 Lite sta arrivando su AI Mode nella Ricerca, NotebookLM, Google Photos, Stitch, Google Flow e Google Ads.

Gemini Omni Flash: editing video con il linguaggio naturale

Gemini Omni Flash (gemini-omni-flash-preview) era stato annunciato al Google I/O e oggi arriva ufficialmente agli sviluppatori tramite API. Il modello supporta la generazione di video da testo, immagini e video in input, e permette di modificare i filmati tramite istruzioni in linguaggio naturale, il che è la parte più interessante per chi lavora con contenuti multimediali.

Le capacità principali includono:

  • Editing conversazionale: si modifica il video descrivendo a parole cosa si vuole cambiare
  • Referencing multimodale: si combinano immagini, testo e video per mantenere coerenza visiva
  • Conoscenza del mondo reale: il modello attinge alle conoscenze di Gemini per costruire narrative credibili
  • Sincronizzazione testo-azione: testi e grafiche si collegano direttamente alle azioni nel video

Il prezzo è di 0,10 dollari al secondo di video generato, in linea con Veo 3.1 Fast.

Ci sono però limitazioni importanti da conoscere: le generazioni sono attualmente limitate a 10 secondi, non è ancora supportato l’upload di riferimenti audio, i video di riferimento fino a 3 secondi vengono accettati dallo schema API ma non elaborati correttamente, e la coerenza dei personaggi nelle transizioni di scena è ancora imprecisa. Google dichiara di stare lavorando su questi punti.

La vera proposta di valore che Google vuole comunicare è la catena tra i due modelli: si genera un’immagine con Nano Banana 2 Lite (veloce ed economico), poi la si passa a Omni Flash per animarla in un video. Tramite l’Interactions API è possibile mantenere la cronologia della sessione e impilare fino a tre modifiche sequenziali. Google ha già pubblicato alcune app demo per mostrare questo workflow: una per teletrasportarsi in luoghi iconici partendo da un selfie, una per il design d’interni, una per creare video di prodotto in stile e-commerce.

Entrambi i modelli usano il watermarking SynthID di Google e il contenuto generato è verificabile tramite l’app Gemini, Gemini in Chrome o la Ricerca.

Una buona notizia sul fronte della trasparenza, anche se resta da vedere quanto questo sistema sarà davvero adottato nella pratica.


Source link

articoli Correlati

Back to top button
Translate »