Google ha svelato Gemini Deep Research, una versione significativamente più potente del suo agente di Intelligenza Artificiale (IA), progettata per affrontare compiti di ricerca a lungo termine e sintetizzare le scoperte in report dettagliati. Attualmente disponibile per gli sviluppatori, si prevede che l'agente sarà presto integrato nelle applicazioni consumer di Google, tra cui Gemini, Google Search e NotebookLM.
Il rinnovato Gemini Deep Research si distingue come il primo agente integrato nella nuova interfaccia Interactions API, concepita come un punto di accesso unificato per interagire con modelli (come Gemini 3 Pro) e agenti. Questo nuovo API di Google è progettato per sfruttare le capacità più avanzate dei modelli, tra cui il "ragionamento" e l'utilizzo di strumenti sofisticati che vanno oltre la semplice generazione di testo.
"Stiamo ampliando le capacità degli agenti integrati e introducendo la possibilità di creare e utilizzare agenti personalizzati. Ciò consentirà agli utenti di connettere i modelli Gemini, gli agenti integrati di Google e i propri agenti tramite un unico API", ha annunciato Google in un post sul blog ufficiale. Questa mossa strategica mira a fornire agli sviluppatori una piattaforma flessibile e potente per costruire applicazioni IA innovative.
Ottimizzato per compiti di raccolta e sintesi di contesti prolungati, l'agente Gemini Deep Research sfrutta appieno le potenzialità di Gemini 3 Pro. Google presenta il suo sistema come "specificamente addestrato per ridurre le illusioni e massimizzare la qualità dei report durante l'esecuzione di compiti complessi". In risposta a una richiesta dell'utente, l'agente "formula query, legge i risultati, identifica lacune nelle conoscenze ed esegue una nuova ricerca". Secondo l'azienda, è stato anche "notevolmente migliorato il web search, consentendogli di navigare in profondità nei siti alla ricerca di dati specifici".
Un'area in cui Gemini 3 Pro eccelle rispetto ai suoi predecessori è il ragionamento visivo. Secondo Google, il modello è in grado di eseguire compiti come la pianificazione delle traiettorie di movimento di un robot di magazzino. Nella risoluzione di compiti di elaborazione di documenti, può estrarre informazioni da testo manoscritto, diagrammi e notazioni matematiche.
La nuova versione di Gemini Deep Research sfrutta le funzionalità di ragionamento visivo di Gemini 3 Pro per automatizzare i compiti di ricerca di dati. Ad esempio, l'agente può scansionare documenti caricati dall'utente per trovare informazioni specifiche. Questa capacità potrebbe rivelarsi preziosa in una vasta gamma di settori, dalla ricerca scientifica all'analisi finanziaria.
Il rinnovato Gemini Deep Research ha superato Gemini 3 Pro in una serie di test. In particolare, Gemini Deep Research ha mostrato un punteggio del 46,4% contro il 43,2% di Gemini 3 Pro nel set completo di HLE (Humanity’s Last Exam, logica e conoscenza), 66,1% contro 56,6% in DeepSearchQA (ricerca web complessa) e 59,2% contro 49,4% in BrowseComp (ricerca di fatti difficili da trovare). Questi risultati preliminari suggeriscono che Gemini Deep Research rappresenta un significativo passo avanti nelle capacità degli agenti IA di Google.
L'introduzione di Gemini Deep Research sottolinea l'impegno continuo di Google nello sviluppo di tecnologie IA avanzate che possano migliorare la produttività e l'efficienza in diversi ambiti. Con la sua capacità di eseguire ricerche approfondite e sintetizzare informazioni complesse, questo nuovo agente IA potrebbe trasformare il modo in cui interagiamo con il web e accediamo alla conoscenza.
Prima di procedere


