Gemini 3 Deep Think: l’IA che corregge i matematici e progetta in 3D
Nel mondo della ricerca scientifica e dell’ingegneria, le domande difficili non mancano, mentre le risposte chiare spesso sì. È proprio su questo terreno scivoloso che entra in gioco il nuovo Gemini 3 Deep Think, la modalità di ragionamento più specializzata di Google, pensata per affrontare problemi complessi dove i dati sono incompleti e le soluzioni non sono mai una sola.
In questa nuova versione, Deep Think vuole combinare conoscenza scientifica profonda e utilità ingegneristica quotidiana, passando dalla teoria alla pratica. Non si limita quindi a fare i conti giusti, ma prova a diventare uno strumento operativo per chi lavora ogni giorno tra formule, laboratori e prototipi.
Vuoi ascoltare il riassunto dell’articolo?
Che cos’è il nuovo Gemini 3 Deep Think
Il nuovo Gemini 3 Deep Think è un aggiornamento importante della modalità di ragionamento più specializzata dei modelli Gemini 3. Google lo ha sviluppato in stretta collaborazione con scienziati e ricercatori, con l’obiettivo di affrontare sfide dove mancano riferimenti chiari, i dati sono disordinati e spesso non esiste una sola risposta corretta.
Deep Think mira a unire rigore matematico e utilità ingegneristica, così da non restare confinato alla teoria astratta. L’idea è usare la capacità di ragionamento del modello per supportare attività reali: dalla lettura critica di articoli scientifici alla progettazione di componenti fisici, fino alla modellazione di sistemi complessi tramite codice.
L’aggiornamento è disponibile nella app Gemini per chi ha un abbonamento a Google AI Ultra e, per la prima volta, arriva anche tramite Gemini API per una selezione di ricercatori, ingegneri e aziende che possono chiedere l’accesso anticipato.

Come lo stanno usando i primi tester
Una delle prime applicazioni concrete del nuovo Deep Think arriva dal lavoro di Lisa Carbone, matematica della Rutgers University. Carbone studia le strutture matematiche richieste dalla comunità di fisica delle alte energie per collegare la teoria della gravità di Einstein con la meccanica quantistica. In un campo dove i dati di addestramento sono pochissimi, ha usato Deep Think per rivedere un articolo di matematica altamente tecnico.
In questo contesto, Deep Think ha individuato un difetto logico sottile in un lavoro che aveva già superato la peer review umana. Un risultato che evidenzia il potenziale del modello come strumento di controllo critico, soprattutto in ambiti dove la complessità rende facile lasciarsi sfuggire passaggi chiave.
Un altro caso arriva dal Wang Lab della Duke University, che ha utilizzato Deep Think per ottimizzare i metodi di fabbricazione legati alla crescita di cristalli complessi, con l’obiettivo di scoprire nuovi materiali semiconduttori. Il modello ha progettato una vera e propria “ricetta” di crescita per film sottili più grandi di 100 μm, centrando un obiettivo preciso che in precedenza aveva creato difficoltà.
Nel settore hardware, Anupam Pathak, responsabile R&D nella divisione Platforms and Devices di Google ed ex CEO di Liftware, ha messo alla prova Deep Think per accelerare la progettazione di componenti fisici. In questo scenario, l’attenzione si sposta dall’astrazione matematica alla fase concreta di design, dove la capacità di ragionare su vincoli e forme può ridurre tentativi ed errori.
Risultati sui benchmark di ragionamento
Google collega il nuovo Gemini 3 Deep Think a una serie di risultati su benchmark accademici molto selettivi, pensati per misurare il ragionamento di modelli di frontiera. Già in passato, versioni specializzate di Deep Think avevano raggiunto standard da medaglia d’oro in competizioni internazionali di matematica e programmazione.
Con l’aggiornamento, Deep Think stabilisce un nuovo riferimento con un 48,4% (senza strumenti esterni) su Humanity’s Last Exam, un benchmark costruito per testare i limiti dei modelli di ultima generazione. Il modello ottiene anche un 84,6% su ARC-AGI-2, risultato verificato dalla ARC Prize Foundation, che punta a misurare capacità di generalizzazione e ragionamento astratto.
Sul fronte della programmazione competitiva, Deep Think raggiunge un Elo di 3455 su Codeforces, piattaforma che raccoglie sfide di coding ad alta difficoltà. Inoltre, mantiene prestazioni da medaglia d’oro all’International Math Olympiad 2025, confermando una forte specializzazione nella risoluzione di problemi matematici complessi.
Oltre la matematica: fisica, chimica e teoria
Il nuovo Deep Think non si ferma alla matematica e al coding.
Secondo quanto riportato, il modello mostra risultati di livello medaglia d’oro anche nelle sezioni scritte delle Olimpiadi Internazionali di Fisica 2025 e Chimica 2025. Si tratta di prove che richiedono non solo calcoli, ma anche capacità di spiegare e strutturare il ragionamento.
Nel campo della fisica teorica avanzata, Deep Think ottiene un 50,5% su CMT-Benchmark, un test che misura la competenza in materia condensata teorica. Il dato indica una capacità di muoversi in un dominio dove i problemi richiedono una combinazione di formalismo matematico e comprensione fisica.
Questi risultati collocano Deep Think in un’area in cui modelli generali faticano: la gestione di domini scientifici complessi, con vincoli rigorosi e poca tolleranza agli errori concettuali. Resta comunque un supporto da usare con attenzione critica, soprattutto quando entra in gioco la validazione scientifica.
Dalla teoria all’ingegneria pratica
Oltre ai numeri sui benchmark, Google insiste sull’aspetto più pratico del nuovo Deep Think: supportare ricercatori e ingegneri nell’interpretazione di dati complessi e nella modellazione di sistemi fisici tramite codice.
L’obiettivo dichiarato è portare il modello dove serve davvero, a partire dall’accesso tramite Gemini API.
Un esempio concreto riguarda la progettazione per stampa 3D. Con l’aggiornamento, Deep Think può analizzare uno schizzo, ricostruire la forma complessa che rappresenta e generare un file adatto alla stampa 3D. In pratica, il modello traduce un disegno in un oggetto fisico potenzialmente realizzabile, collegando direttamente l’input visivo alla produzione.
Questa capacità si inserisce in un quadro più ampio, in cui Deep Think punta a diventare uno strumento per accelerare prototipazione e sperimentazione. Resta comunque fondamentale che chi lo utilizza mantenga il controllo delle decisioni finali, soprattutto quando si passa dal modello al laboratorio o alla linea di produzione.
Dal punto di vista della disponibilità, l’aggiornamento arriva subito per chi ha un abbonamento Google AI Ultra nella app Gemini. In parallelo, scienziati, ingegneri e imprese possono manifestare interesse per accedere in anticipo a Deep Think tramite Gemini API, inserendolo così nei propri flussi di lavoro sperimentali.
Gruppo Facebook
Source link





