La storia di come la tecnologia del deep learning sia nata su hardware originariamente destinato ad altri scopi è affascinante. Jensen Huang, CEO di Nvidia, ha rivelato che i pionieri del deep learning hanno compiuto le loro prime scoperte utilizzando un paio di schede video GeForce GTX 580 da 3 GB in configurazione SLI, già nel 2012.
All'Università di Toronto, un team di ricercatori composto da Alex Krizhevsky, Ilya Sutskever e Geoffrey Hinton stava lavorando a metodi innovativi per migliorare il riconoscimento delle immagini nei sistemi di visione artificiale. Era il 2011 e le reti neurali, come le conosciamo oggi, erano ancora un concetto lontano. Invece, si utilizzavano algoritmi manuali per identificare bordi, angoli e texture nelle immagini.
Da questo lavoro nacque AlexNet, un'architettura composta da otto strati e circa 60 milioni di parametri. La sua peculiarità risiedeva nella capacità di apprendere autonomamente attraverso una combinazione di strati convoluzionali e neurali profondi. Questa architettura si dimostrò talmente efficace da superare del 70% l'algoritmo di riconoscimento immagini più avanzato dell'epoca, attirando immediatamente l'attenzione del settore.
Huang ha raccontato che AlexNet fu sviluppato su due GeForce GTX 580 in modalità SLI. La rete era ottimizzata per sfruttare entrambi i processori grafici, con i due GPU che comunicavano solo quando strettamente necessario, riducendo drasticamente i tempi di training. Questo rende la GTX 580 la prima scheda video al mondo ad aver supportato una rete di deep learning/machine learning.
L'ironia della sorte è che, in quel periodo, Nvidia investiva relativamente poco nell'AI. Le sue risorse erano concentrate principalmente sulla grafica 3D per videogiochi e sulla tecnologia CUDA. La GeForce GTX 580 era stata progettata specificamente per il gaming e non offriva funzionalità avanzate per accelerare le reti di deep learning. Tuttavia, il parallelismo intrinseco delle GPU si rivelò essere esattamente ciò di cui le reti neurali avevano bisogno per operare velocemente.
Secondo Jensen Huang, il successo di AlexNet e della GeForce GTX 580 spinse Nvidia a investire nello sviluppo di hardware dedicato all'AI. Nel 2012, una volta compreso il potenziale del deep learning per risolvere problemi globali, l'azienda dedicò tutte le sue risorse e competenze a questa tecnologia. Questo portò alla creazione della piattaforma Nvidia DGX basata sull'architettura Volta, con i Tensor Core di prima generazione e la tecnologia DLSS nel 2016. Senza quella coppia di GeForce GTX 580 e AlexNet, Nvidia potrebbe non essere diventata il gigante dell'AI che è oggi. Il percorso di Nvidia dimostra come l'innovazione possa nascere inaspettatamente, trasformando un prodotto nato per il gaming in uno strumento fondamentale per il futuro dell'intelligenza artificiale. La GTX 580 non è stata solo una scheda grafica, ma un catalizzatore per una rivoluzione tecnologica.
Prima di procedere


