Nvidia ha annunciato il rilascio di Nemotron 3 Super, un modello di intelligenza artificiale (IA) open source di tipo Mixture-of-Experts (MoE) progettato specificamente per potenziare gli agenti intelligenti. Questo modello all'avanguardia vanta ben 120 miliardi di parametri totali, con 12 miliardi di parametri attivi, e si distingue per la sua architettura ibrida Mamba-Transformer.
Secondo Nvidia, Nemotron 3 Super rappresenta il primo modello della serie Nemotron 3 a integrare la paradigmatica LatentMoE, i livelli Multi-Token Prediction e il pre-training NVFP4. L'azienda afferma che questa combinazione di elementi incrementa significativamente la precisione e accelera l'inferenza. L'architettura ibrida di Nemotron 3 Super promette una capacità di elaborazione fino a cinque volte superiore e una precisione raddoppiata rispetto al precedente modello Nemotron Super. Un'altra caratteristica distintiva è il supporto per una finestra di contesto di 1 milione di token, che consente agli agenti IA di mantenere in memoria l'intero stato del flusso di lavoro e prevenire deviazioni dall'obiettivo prefissato.
Le capacità di Nemotron 3 Super lo rendono particolarmente adatto per affrontare compiti complessi all'interno di sistemi multi-agente. Ad esempio, può essere utilizzato per la generazione e il debug di codice senza la necessità di segmentare i documenti, oppure per l'analisi finanziaria, dove è possibile caricare e gestire migliaia di pagine di report. Il modello è stato addestrato utilizzando dati sintetici generati con modelli di ragionamento logico.
Nvidia ha reso pubblica la metodologia completa utilizzata per lo sviluppo di Nemotron 3 Super, inclusi oltre 10 trilioni di token di dataset pre e post-training, 15 ambienti di formazione per l'apprendimento con rinforzo e le ricette di valutazione. I ricercatori hanno la possibilità di sfruttare ulteriormente la piattaforma Nvidia NeMo per affinare il modello o crearne uno personalizzato. L'azienda rende disponibile la metodologia completa, includendo oltre 10 trilioni di token di set di dati pre e post-formazione, 15 ambienti di formazione per l'apprendimento con rinforzo e ricette di valutazione.
Nemotron 3 Super supporta la piattaforma Nvidia Blackwell nel formato NVFP4, riducendo i requisiti di memoria e accelerando l'inferenza di quattro volte rispetto a FP8 su Nvidia Hopper, senza compromettere la precisione. Il modello è già disponibile per l'uso e può essere accessibile tramite build.nvidia.com, Hugging Face, OpenRouter e Perplexity. Tra i partner per i servizi cloud e di inferenza figurano Google Cloud Vertex AI, Oracle Cloud Infrastructure, CoreWeave, Together AI, Baseten, Cloudflare, DeepInfra, Fireworks AI e Modal. Inoltre, il modello è disponibile come microservizio Nvidia NIM per l'implementazione in ambienti locali e cloud.
L'introduzione di Nemotron 3 Super rappresenta un passo significativo verso un'IA più potente, flessibile e accessibile. La sua architettura avanzata, la capacità di gestire contesti ampi e la disponibilità open source lo rendono uno strumento prezioso per ricercatori, sviluppatori e aziende che desiderano esplorare le potenzialità degli agenti intelligenti in una vasta gamma di applicazioni.

