Apple rivoluziona l'addestramento dei robot umanoidi con dati umani

Apple rivoluziona l'addestramento dei robot umanoidi con dati umani

Una collaborazione innovativa con MIT e Carnegie Mellon per migliorare la flessibilità e l'efficienza dei robot grazie a video in prima persona

In una svolta tecnologica innovativa, i ricercatori di Apple hanno presentato un nuovo approccio per l'addestramento dei robot umanoidi nel loro recente studio intitolato “Humanoid Policy ∼ Human Policy”. Questa iniziativa è frutto di una collaborazione tra Apple, il Massachusetts Institute of Technology (MIT), Carnegie Mellon, l'Università di Washington e l'Università della California, San Diego. L'obiettivo principale è esplorare come i filmati in prima persona, che ritraggono persone mentre manipolano oggetti, possano essere utilizzati per addestrare modelli robotici di uso generale.

I ricercatori hanno raccolto più di 25.000 dimostrazioni umane e 1.500 dimostrazioni robotiche, creando un dataset denominato PH2D. Questi dati sono stati utilizzati per alimentare un'unica politica di intelligenza artificiale in grado di controllare un vero robot umanoide nel mondo fisico. Come spiegano gli autori dello studio, addestrare robot per la manipolazione con dati vari consente di migliorarne la robustezza e la capacità di generalizzazione attraverso diversi compiti e piattaforme. Tuttavia, imparare unicamente dalle dimostrazioni robotiche richiede un notevole lavoro e la raccolta di dati teleoperati costosi, difficili da scalare.

Lo studio introduce una soluzione più scalabile: le dimostrazioni umane egocentriche, che servono come dati di addestramento cross-emobdiment per l'apprendimento robotico. Grazie a questo approccio, gli esseri umani possono indicare la via da seguire, rendendo l'addestramento dei robot più efficiente in termini di tempo e costi.

Il team ha sviluppato un'applicazione per Apple Vision Pro in grado di catturare video dalla videocamera inferiore sinistra del dispositivo e utilizzare il kit AR di Apple per tracciare il movimento 3D della testa e delle mani. In alternativa, per offrire una soluzione più economica, hanno creato un supporto stampato in 3D per collegare una telecamera ZED Mini Stereo ad altri visori, come il Meta Quest 3, offrendo un tracciamento del movimento 3D simile a un costo inferiore.

Grazie a questo sistema, è stato possibile registrare dimostrazioni di alta qualità in pochi secondi, un notevole miglioramento rispetto ai metodi tradizionali di teleoperazione robotica, che sono più lenti, costosi e difficili da scalare. Un dettaglio particolarmente interessante è che, poiché le persone si muovono molto più velocemente dei robot, i ricercatori hanno rallentato le dimostrazioni umane di quattro volte durante l'addestramento, consentendo al robot di restare al passo senza necessità di ulteriori aggiustamenti.

Il fulcro di tutta la ricerca è il Human Action Transformer (HAT), un modello addestrato sia sulle dimostrazioni umane che robotiche in un formato condiviso. Invece di separare i dati per fonte, HAT impara una sola politica che si generalizza su entrambi i tipi di corpi, rendendo il sistema più flessibile ed efficiente nel consumo di dati. In alcuni test, questo approccio di addestramento condiviso ha aiutato il robot a gestire compiti più complessi, inclusi quelli non affrontati precedentemente, rispetto ai metodi tradizionali.

Il dataset PH2D, confrontato con metodi tradizionali, offre un'interessante opportunità di studio per chiunque sia coinvolto nel campo della robotica. Questo studio rappresenta un passo significativo verso l'innovazione nell'addestramento dei robot umanoidi, aprendo la strada a nuove possibilità e miglioramenti nel campo della robotica e dell'intelligenza artificiale.

Pubblicato Giovedì, 22 Maggio 2025 a cura di Anna S. per Infogioco.it

Ultima revisione: Giovedì, 22 Maggio 2025

Anna S.

Anna S.

Anna è una giornalista dinamica e carismatica, con una passione travolgente per il mondo dell'informatica e le innovazioni tecnologiche. Fin da giovane, ha sempre nutrito una curiosità insaziabile per come la tecnologia possa trasformare le vite delle persone. La sua carriera è caratterizzata da un costante impegno nell'esplorare le ultime novità in campo tecnologico e nel raccontare storie che ispirano e informano il pubblico.


Consulta tutti gli articoli di Anna S.

Footer
Articoli correlati
WorldMatch - Gambling software solutions
Infogioco.it - Sconti