Runway AI, nota per i suoi generatori di immagini e video, ha compiuto un passo rivoluzionario presentando GWM-1 (Generative World Model 1), un'innovativa intelligenza artificiale capace di generare mondi virtuali. Questa tecnologia all'avanguardia si basa sulla previsione frame-by-frame, creando simulazioni che comprendono la fisica e il comportamento del mondo nel tempo. GWM-1 rappresenta un cambio di paradigma nel campo dell'IA, aprendo nuove frontiere per il gaming, la robotica e la creazione di contenuti.
Un modello del mondo, in questo contesto, è un sistema di IA che apprende simulazioni interne con processi che possono verificarsi nel mondo reale. Questo permette al sistema di ragionare, pianificare ed eseguire azioni senza la necessità di essere addestrato su ogni possibile scenario del mondo reale. Anastasis Germanidis, CEO di Runway, ha dichiarato: "Per creare un modello del mondo, dovevamo prima sviluppare un modello video di qualità veramente elevata. Crediamo che il modo giusto per creare modelli del mondo sia addestrarli a prevedere i pixel direttamente, e questo è il modo migliore per ottenere una modellazione universale. Con una scala sufficiente e con i dati giusti, è possibile creare un modello che comprenda sufficientemente bene come funziona il mondo".
Runway ha presentato tre versioni della sua nuova creazione: GWM-Worlds, GWM-Robotics e GWM-Avatars. GWM-Worlds è un'applicazione che consente di creare progetti interattivi. L'utente definisce la scena iniziale tramite una richiesta di testo o un'immagine di esempio, e man mano che esplora lo spazio, il modello genera un mondo tenendo conto della geometria, della fisica e dell'illuminazione. La simulazione viene eseguita con una risoluzione di 720p e una velocità di 24 fotogrammi al secondo. GWM-Worlds si rivela particolarmente utile nello sviluppo di videogiochi, ma è anche adatta per l'addestramento di agenti di navigazione e agenti di azione nel mondo reale. L'innovazione risiede nella capacità del sistema di apprendere e adattarsi in modo dinamico, offrendo un'esperienza utente immersiva e reattiva.
GWM-Robotics è progettato per la generazione di dati sintetici, arricchiti da nuovi parametri come cambiamenti nelle condizioni meteorologiche o la comparsa di ostacoli. Questo metodo aiuta a identificare quando e in quali condizioni i robot sono in grado di violare le regole in base a diversi scenari. Questa capacità è fondamentale per lo sviluppo di robot autonomi sicuri e affidabili, in grado di operare in ambienti complessi e imprevedibili. La simulazione di scenari diversi permette di testare e perfezionare il comportamento dei robot in situazioni estreme, garantendo prestazioni ottimali in ogni circostanza.
GWM-Avatars è dedicato alla creazione di avatar realistici e alla simulazione del comportamento umano. Al momento, Worlds, Robotics e Avatars funzionano come modelli separati, ma Runway prevede di unirli in futuro. L'integrazione di queste tre componenti promette di rivoluzionare il modo in cui interagiamo con la tecnologia, aprendo nuove possibilità per la comunicazione, l'intrattenimento e la formazione.
L'azienda ha anche annunciato un aggiornamento del suo modello base Gen 4.5, che ora è in grado di generare audio integrato e creare video lunghi multi-frame. Questo significa clip di un minuto con coerenza dei personaggi, dialoghi integrati, suoni di sottofondo e inquadrature complesse da diverse angolazioni. È anche possibile modificare una traccia audio esistente, aggiungere dialoghi e modificare video multi-frame di qualsiasi lunghezza. Tutti gli utenti dei piani tariffari a pagamento possono lavorare con il generatore di video Runway Gen 4.5. GWM-Robotics sarà disponibile tramite SDK; sono in corso trattative con i partner per l'integrazione di GWM-Robotics e GWM-Avatars per i creatori di robotica e altre imprese. La combinazione di queste tecnologie potrebbe portare a nuove applicazioni in settori come la sanità, l'istruzione e l'intrattenimento.
Prima di procedere


