Nvidia Nemotron 3: IA Open Source per agenti intelligenti

Nvidia ha annunciato la sua nuova famiglia di modelli Nemotron 3, una svolta significativa nel campo dell'intelligenza artificiale generativa. Questi modelli, caratterizzati dall'essere open source, sono specificamente progettati per la creazione di agenti intelligenti di nuova generazione, aprendo nuove frontiere nell'automazione e nell'interazione uomo-macchina.

Il primo modello della serie, Nemotron 3 Nano 30B, è un modello con 30 miliardi di parametri totali e 3 miliardi di parametri attivi. Questa architettura ibrida Mamba-Transformer combina una "miscela di esperti" (MoE), l'apprendimento con rinforzo (RL) in ambienti interattivi e una finestra di contesto di 1 milione di token, garantendo prestazioni elevate e un ragionamento a lungo termine per applicazioni multi-agente. Il modello Nemotron 3 Nano è già disponibile con guide pronte all'uso, mentre Nemotron 3 Super e Ultra saranno rilasciati successivamente.

Secondo quanto riportato da VideoCardz, il sistema di routing di Nemotron 3 Nano attiva 6 esperti su 128 per ogni passaggio, ottimizzando l'efficienza computazionale. Nvidia ha specificato che per l'esecuzione del modello si possono utilizzare sistemi DGX Spark, oltre agli acceleratori H100 e B200. L'architettura ibrida Mamba-Transformer MoE migliora l'efficienza del testing e del ragionamento a lungo termine, rendendo Nemotron 3 particolarmente adatto per sistemi che richiedono interazioni complesse e prolungate.

Le innovazioni di Nemotron 3 rispondono direttamente alle esigenze dei sistemi di agenti, tra cui:

Architettura ibrida Mamba-Transformer MoE: Per un'efficienza superiore nel testing e nel ragionamento a lungo termine.
Apprendimento multi-ambiente con rinforzo: Sviluppato su compiti di agenti reali.
Finestra di contesto di 1 milione di token: Supporta il ragionamento approfondito su più documenti e la memoria a lungo termine degli agenti. Ciò assicura un pensiero logico coerente in grandi basi di codice, documenti estesi, dialoghi prolungati e contenuti estratti aggregati. Invece di utilizzare algoritmi di segmentazione euristici frammentati, gli agenti possono memorizzare interi insiemi di prove, buffer di storia e piani multi-stadio in un'unica finestra di contesto.
Pipeline di apprendimento aperta e trasparente: Inclusi dati, pesi e ricette.

La famiglia MoE Nemotron 3 include tre modelli principali:

Nemotron 3 Nano: Un modello compatto con 30 miliardi di parametri, che attiva fino a 3 miliardi di parametri contemporaneamente per compiti mirati ad alta efficienza.
Nemotron 3 Super: Un modello di ragionamento ad alta precisione con circa 100 miliardi di parametri e fino a 10 miliardi di parametri attivi per token, progettato per applicazioni multi-agente complesse.
Nemotron 3 Ultra: Un modello di ragionamento di grandi dimensioni, ideale per scenari che richiedono una capacità di elaborazione massiccia.

L'approccio di Nvidia con Nemotron 3 mira a fornire strumenti accessibili e potenti per la comunità dell'intelligenza artificiale, promuovendo l'innovazione e lo sviluppo di applicazioni sempre più sofisticate. La disponibilità di modelli open source e guide dettagliate facilita l'adozione e la sperimentazione da parte di sviluppatori e ricercatori, accelerando il progresso nel campo degli agenti intelligenti e dell'IA generativa. Con Nemotron 3, Nvidia si posiziona all'avanguardia della rivoluzione dell'IA, offrendo soluzioni complete e versatili per affrontare le sfide del futuro.