Google Gemini 3 Deep Think: L'IA che sfida i limiti della scienza e dell'ingegneria

La nuova piattaforma di intelligenza artificiale di Google promette di risolvere problemi complessi e di superare i test più impegnativi, ma con qualche limite

Google Gemini 3 Deep Think: L'IA che sfida i limiti della scienza e dell'ingegneria

Google ha annunciato il rilascio di un importante aggiornamento per Gemini 3 Deep Think, una piattaforma basata sull'intelligenza artificiale (IA) progettata per affrontare sfide complesse nei campi della scienza e dell'ingegneria. Questa nuova versione è frutto della collaborazione con scienziati e mira a risolvere problemi di ricerca complessi, caratterizzati da aspetti non chiaramente definiti, dati incompleti o non sistematici e dall'assenza di un'unica soluzione corretta. Deep Think rappresenta un tentativo di tradurre la teoria astratta in applicazioni pratiche.

La piattaforma è accessibile direttamente nell'applicazione Gemini, ma solo per gli abbonati a Google AI Ultra. Google prevede di aprire l'accesso al servizio tramite API Gemini, previa richiesta, a ingegneri, ricercatori e aziende interessate.

Nei test, Google Gemini 3 Deep Think ha ottenuto risultati notevoli. Nel test Humanity’s Last Exam, ha raggiunto il 48,4% senza l'ausilio di strumenti esterni, mentre nel benchmark ARC-AGI-2 ha conseguito un punteggio senza precedenti dell'84,6%. Nel test di programmazione Codeforces, ha ottenuto un rating Elo di 3455. Nelle competizioni delle Olimpiadi Internazionali di Matematica 2025, il sistema ha dimostrato un livello da medaglia d'oro, risultato replicato anche nelle olimpiadi di chimica e fisica. Nel test CMT-Benchmark, Google Gemini 3 Deep Think ha mostrato un'elevata padronanza della fisica teorica, ottenendo un punteggio del 50,5%.

La base di Gemini 3 Deep Think è un agente IA denominato Aletheia, sviluppato nel laboratorio Google DeepMind. Questo agente include un sistema di verifica delle ipotesi formulate in linguaggio naturale, utile per individuare lacune nelle soluzioni proposte. Il processo è iterativo, consentendo la generazione e la correzione continua delle soluzioni. Un aspetto importante è la capacità dell'agente di ammettere la propria incapacità di rispondere a una domanda. Per affrontare ricerche complesse, Aletheia si serve del motore di ricerca Google e di strumenti di navigazione web, evitando di fornire collegamenti inesistenti e cercando di ridurre al minimo le imprecisioni nei calcoli durante la preparazione di sintesi della letteratura pubblicata.

I risultati ottenuti e potenziali di Aletheia sono stati suddivisi dagli sviluppatori di Google in cinque livelli di valutazione. In modalità quasi completamente autonoma, l'agente IA ha delineato possibili soluzioni a tre problemi aperti formulati dal matematico Pál Erdős, ottenendo una valutazione di livello zero, corrispondente a una "novità insignificante". Nello stesso modo, ha proposto una soluzione a un altro problema dello stesso insieme, raggiungendo il primo livello, o "novità minima". Al secondo livello, "adatto alla pubblicazione", Aletheia ha mostrato risultati in modalità autonoma, in collaborazione con un essere umano e come strumento di supporto. I livelli terzo ("svolta significativa") e quarto ("svolta epocale") sono ancora fuori dalla portata dell'IA.

Su incarico degli sviluppatori, Aletheia ha analizzato 700 problemi matematici irrisolti di Erdős, riuscendo ad affrontarne 13. Tuttavia, per 9 di questi problemi esistevano già delle soluzioni, mentre solo 4 sembrano essere stati risolti per la prima volta dall'IA. Inoltre, su 212 soluzioni prodotte dall'IA, solo il 6,5% sono risultate "sostanzialmente corrette". Le restanti presentavano difetti fondamentali (68,5%) o risolvevano versioni interpretate erroneamente dei problemi originali (31,5%).

In conclusione, gli sviluppatori hanno ammesso che la loro IA mostra una "tendenza a fraintendere la domanda in modo da rendere più facile la risposta" e rimane "estremamente incline all'errore rispetto agli esseri umani". Pertanto, al momento, l'IA non è in grado di sostituire i matematici, ma rappresenta un valido strumento di supporto alla ricerca e all'analisi dei dati.

Pubblicato Venerdì, 13 Febbraio 2026 a cura di Anna S. per Infogioco.it

Ultima revisione: Venerdì, 13 Febbraio 2026

Anna S.

Anna S.

Anna è una giornalista dinamica e carismatica, con una passione travolgente per il mondo dell'informatica e le innovazioni tecnologiche. Fin da giovane, ha sempre nutrito una curiosità insaziabile per come la tecnologia possa trasformare le vite delle persone. La sua carriera è caratterizzata da un costante impegno nell'esplorare le ultime novità in campo tecnologico e nel raccontare storie che ispirano e informano il pubblico.


Consulta tutti gli articoli di Anna S.

Footer
Articoli correlati
Contenuto promozionale
Contenuto promozionale
Contenuto promozionale
Contenuto promozionale
Infogioco.it - Sconti