L'innovazione nel campo dell'Intelligenza Artificiale (AI) compie un altro balzo in avanti grazie ad Andrej Karpathy, figura di spicco precedentemente alla guida dei progetti AI di Tesla e co-fondatore di OpenAI. Karpathy, noto anche per aver coniato il termine 'вайбкодинг', ha recentemente rilasciato su GitHub un progetto open source destinato a rivoluzionare il modo in cui la ricerca scientifica viene condotta.
A differenza dei complessi modelli o dei prodotti aziendali su larga scala, si tratta di un semplice script di 630 righe, ma con un obiettivo ambizioso: automatizzare il metodo scientifico attraverso l'uso di agenti AI autonomi, capaci di operare senza supervisione umana, anche durante le ore notturne.
'L'obiettivo è strutturare i tuoi agenti in modo che possano progredire autonomamente nella ricerca a una velocità incredibile', ha scritto Karpathy sul social network X. Il messaggio è diventato virale, superando gli 8,6 milioni di visualizzazioni in soli due giorni. Il sistema ideato da Karpathy si configura come un ciclo di ottimizzazione autonomo. Un agente AI riceve uno script di addestramento e un budget computazionale predefinito (tipicamente 5 minuti su una GPU). L'agente analizza il proprio codice sorgente, formula ipotesi per miglioramenti (come la modifica del tasso di apprendimento o della profondità dell'architettura), apporta modifiche al codice, esegue un esperimento e valuta i risultati.
Se le perdite di validazione – misurate in bit per byte (val_bpb) – migliorano, l'agente salva la modifica; altrimenti, la annulla e riprova. In una sola notte, un agente AI ha eseguito 126 esperimenti, riducendo le perdite da 0,9979 a 0,9697. Dopo una messa a punto di due giorni, l'agente ha gestito con successo circa 700 modifiche autonome, individuando approssimativamente 20 miglioramenti additivi che si sono trasferiti positivamente su modelli più grandi.
'Vedere l'agente eseguire autonomamente l'intero flusso di lavoro dall'inizio alla fine è incredibile', ha commentato Karpathy, sottolineando come l'agente abbia identificato errori di scalatura dell'attenzione e di regolarizzazione che lui stesso aveva trascurato in due decenni di lavoro. Gli esperti del settore ritengono che la ricerca autonoma rappresenti un cambiamento fondamentale nel perfezionamento dell'intelligenza artificiale. Automatizzando il 'metodo scientifico' per il codice, Karpathy ha trasformato l'apprendimento automatico in un processo evolutivo che opera alla velocità del silicio, superando i limiti del pensiero umano. Questo tipo di processo può essere applicato ben oltre i confini dell'IT, in settori come il marketing e la sanità, praticamente in qualsiasi ambito che richieda ricerca e sviluppo.
Varun Mathur, responsabile della piattaforma di aggregazione di strumenti AI Hyperspace AI, ha condotto un esperimento con un singolo agente in una rete peer-to-peer. Ogni nodo su cui operava l'agente Hyperspace è diventato un ricercatore autonomo. In una sola notte, 35 agenti autonomi hanno eseguito 333 esperimenti senza alcun intervento umano.
Secondo Mathur, mentre le GPU H100 avrebbero utilizzato la 'forza bruta', gli agenti che operavano esclusivamente su CPU di laptop sono stati costretti a 'ingegnarsi'. Si sono concentrati su strategie di inizializzazione (come Kaiming e Xavier init) e sulla selezione della normalizzazione, poiché non potevano fare affidamento su un'elevata larghezza di banda. Utilizzando il protocollo GossipSub, gli agenti hanno condiviso i loro successi in tempo reale. Quando uno degli agenti ha scoperto che la strategia Kaiming riduceva le perdite del 21%, questa informazione si è diffusa nella rete come un virus. Nel giro di poche ore, altri 23 agenti hanno incorporato questa scoperta nelle loro ipotesi. In sole 17 ore, gli agenti hanno riscoperto in modo indipendente importanti pietre miliari dell'apprendimento automatico – come RMSNorm e gli embedding correlati – la cui formalizzazione ha richiesto quasi otto anni ai ricercatori di laboratori come Google Brain e OpenAI.
Eric Siu, fondatore dell'agenzia pubblicitaria Single Grain, ha applicato la ricerca automatica di Karpathy al 'ciclo sperimentale' del marketing. Il framework di Siu sostituisce lo script di addestramento con uno strumento di marketing: una landing page, una creatività pubblicitaria o una cold email. L'agente AI modifica una variabile (l'oggetto di un'email o una call to action), la lancia, misura la 'percentuale di risposte positive' e la salva o la elimina.
Siu afferma che questo approccio crea una 'mappa proprietaria' della risposta di un pubblico specifico – una sorta di rapporto derivato non dal codice, ma dalla cronologia degli esperimenti. 'La maggior parte dei team di marketing conduce circa 30 esperimenti all'anno. La prossima generazione ne condurrà più di 36.500. Facile', ha dichiarato Siu. 'Le aziende che vinceranno non avranno i migliori marketer – ha aggiunto – ma cicli di esperimenti più veloci'.
Nonostante l'entusiasmo, le discussioni su GitHub hanno rivelato che la comunità sta cercando di comprendere appieno le implicazioni di un progresso automatizzato così rapido. Sono state espresse preoccupazioni riguardo alla potenziale 'trappola dell'iper-ottimizzazione': con un numero sufficiente di agenti, i parametri potrebbero essere ottimizzati per le peculiarità specifiche dei dati di test, anziché per l'intelligenza generale.
Alla domanda se la diminuzione delle perdite di validazione da 0,9979 a 0,9697 fosse effettivamente significativa, Karpathy ha risposto: 'Stiamo semplicemente ottimizzando le prestazioni per ogni risorsa computazionale... sono miglioramenti reali e sostanziali'. Un sperimentatore ha riferito che 26 dei suoi 35 esperimenti sono falliti o si sono conclusi con un errore, ma quelli di successo hanno dimostrato che 'il modello è migliorato diventando più semplice'. Questa comprensione, ha affermato, è stata raggiunta senza alcun intervento umano.
L'avvento della ricerca automatica potrebbe trasformare il futuro del lavoro di ricerca in diversi campi, dove, grazie a semplici meccanismi di controllo dell'AI, il ruolo dell'uomo si sposta da 'sperimentatore' a 'progettista di esperimenti'. Con l'emergere di tali strumenti, il collo di bottiglia del progresso nel campo dell'AI non è più la capacità umana di programmare, ma la sua abilità nel definire i limiti della ricerca.
Secondo gli analisti, 'Andrej Karpathy ha nuovamente cambiato le carte in tavola: non stiamo più semplicemente codificando modelli, stiamo creando ecosistemi che imparano mentre dormiamo'.

