IA: Cina sfida USA con nuovi modelli Alibaba, ByteDance, Kua

Mentre negli Stati Uniti il mercato dell'Intelligenza Artificiale (IA) è stato focalizzato sull'impatto degli strumenti di Anthropic e Altruist nei settori della programmazione e dei servizi finanziari, in Cina i giganti dell'IT hanno lanciato modelli di IA che mostrano una crescita di produttività nella robotica e nella generazione di video. Alibaba, ByteDance (proprietaria di TikTok) e la piattaforma di video brevi Kuaishou hanno presentato nuovi algoritmi, confermando che gli sviluppatori cinesi non sono secondi a nessuno rispetto ai loro colleghi americani.

L'annuncio dei nuovi algoritmi dei giganti IT cinesi è avvenuto sullo sfondo della recente dichiarazione del capo della divisione IA di Google DeepMind, Demis Hassabis, secondo cui i modelli di IA cinesi sono indietro rispetto ai concorrenti occidentali solo di pochi mesi. Tuttavia, gli strumenti presentati nell'ultima settimana potrebbero essere considerati diretti concorrenti dei modelli di IA per la generazione di video, come Sora di OpenAI, e dei modelli per il settore della robotica di Nvidia e Google.

La divisione di ricerca di Alibaba, DAMO, ha annunciato RynnBrain, un modello di IA progettato per aiutare i robot a comprendere il mondo fisico che li circonda e a identificare gli oggetti. In un video dimostrativo, Alibaba ha mostrato un robot con delle pinze al posto delle mani che raccoglieva arance e le metteva in un cesto, e che prendeva il latte dal frigorifero.

I modelli di IA richiedono un ampio addestramento per raggiungere l'obiettivo di identificare gli oggetti di uso quotidiano e interagire con essi. Questo significa che un processo così semplice per l'uomo come la raccolta di frutta è molto più complesso per la robotica. Con il lancio di RynnBrain, Alibaba inizierà a competere con aziende come Nvidia e Google, che stanno sviluppando i propri modelli di IA per il settore della robotica. La competizione si fa sempre più intensa, con implicazioni significative per il futuro dell'automazione e dell'intelligenza artificiale applicata.

«Una delle principali innovazioni [del modello di IA] è la consapevolezza integrata del tempo e dello spazio. Invece di reagire semplicemente ai segnali immediati, il robot può ricordare quando e dove si sono verificati gli eventi, monitorare i progressi dell'esecuzione di un compito e continuare ad agire attraverso più fasi. Questo lo rende più affidabile e coerente in condizioni reali complesse», afferma Adina Yakefu, ricercatrice di Hugging Face. Ha anche aggiunto che l'«obiettivo più ampio» di Alibaba è quello di «creare un livello intellettuale di base per i sistemi incorporati». Questo suggerisce una visione a lungo termine in cui i robot non solo eseguono compiti specifici, ma comprendono e si adattano al loro ambiente in modo più sofisticato.

ByteDance ha presentato Seedance 2.0, un modello di intelligenza artificiale per la generazione di video che può creare filmati realistici basati su una semplice descrizione testuale. L'algoritmo può anche lavorare con altri video e immagini. I video dimostrativi creati con Seedance 2.0 appaiono molto realistici.

Adina Yakefu ha confermato che il modello di IA Seedance 2.0 ha mostrato progressi significativi rispetto alle versioni precedenti in termini di «gestibilità, velocità ed efficienza». «Ad oggi, Seedance 2.0 è uno dei modelli più bilanciati per la generazione di video che ho testato. Mi ha sorpreso, fornendo risultati soddisfacenti al primo tentativo, anche elaborando una semplice richiesta. Visualizzazione, suono e lavoro dell'operatore si combinano in modo tale che il risultato appaia raffinato e non sperimentale», ha aggiunto Yakefu. Questa capacità di generare video di alta qualità con relativa facilità potrebbe avere un impatto significativo sui settori del marketing, dell'istruzione e dell'intrattenimento.

Sebbene gli utenti ne lodino l'algoritmo, è noto che Seedance 2.0 ha avuto dei problemi. I media cinesi hanno riportato che gli sviluppatori hanno temporaneamente bloccato la funzione di generazione della voce umana basata su una foto caricata. Questo è successo dopo che un blogger locale ha richiamato l'attenzione sul problema della generazione della voce da una foto senza il consenso della persona raffigurata. I rappresentanti di ByteDance non hanno ancora commentato la questione. Questo incidente solleva importanti questioni etiche e di privacy riguardanti l'uso dell'intelligenza artificiale per la generazione di contenuti.

Un'altra novità è il modello di IA Kling 3.0 di Kuaishou, progettato per la generazione di video ed è un concorrente dell'algoritmo di ByteDance. Il comunicato afferma che Kling 3.0 «presenta miglioramenti significativi in termini di coerenza, fotorealismo del risultato, aumento della durata del video fino a 15 secondi e generazione audio integrata in più lingue, dialetti e con accenti diversi». Questa capacità di generare video più lunghi e con audio multilingue potrebbe rendere Kling 3.0 particolarmente attraente per i creatori di contenuti globali.

Attualmente, l'algoritmo Kling 3.0 è disponibile solo per gli abbonati a pagamento, ma Kuaishou promette di aprirlo presto a un pubblico più ampio di utenti. Il successo dell'azienda con i modelli di IA Kling ha contribuito a far crescere il valore delle azioni di Kuaishou di oltre il 50% nell'ultimo anno. Questo dimostra l'importanza crescente dell'intelligenza artificiale nel mercato tecnologico cinese.

Vale la pena menzionare altre importanti release. Zhipu AI, che opera a Hong Kong con il nome di Knowledge Atlas Technology, ha presentato l'algoritmo GLM-5, un modello linguistico aperto con capacità avanzate nella programmazione e nella creazione di agenti IA. La società ha affermato che l'ultima versione del suo modello di IA si avvicina ad Anthropic Claude Opus 4.5 per quanto riguarda i benchmark specializzati e supera Google Gemini 3 Pro in alcuni test. Questa release ha contribuito a una crescita significativa del prezzo delle azioni di Zhipu AI.

Anche il valore dei titoli di MiniMax è salito alla fine della settimana dopo che la società ha lanciato una versione aggiornata del modello di IA aperto M2.5 con strumenti di agenti IA migliorati. Questo algoritmo può essere utilizzato per automatizzare efficacemente l'esecuzione di diverse attività. L'innovazione nel campo dell'intelligenza artificiale continua a guidare la crescita e la competizione nel mercato tecnologico globale.