Alibaba ha recentemente annunciato il lancio di una nuova rivoluzionaria intelligenza artificiale chiamata Qwen3-Next, sviluppata su un'innovativa architettura che promette prestazioni impressionanti. Questa nuova versione non è solo drasticamente più rapida della sua predecessora, ma ha richiesto anche molto meno investimento economico nella sua realizzazione. Qwen3-Next impiega circa un decimo delle risorse finanziarie rispetto alla versione precedente. Tuttavia, i benefici non si fermano qui: le sue capacità di risposta sono paragonabili ai modelli di punta della generazione anteriore.
Un aspetto particolarmente rilevante di questa nuova soluzione è la Qwen3-Next-80B-A3B, che conta 80 miliardi di parametri ma è stata sviluppata con costi di addestramento ridotti di dieci volte rispetto alla Qwen3-32B. Nonostante il risparmio in termini di spesa, la Qwen3-Next offre una velocità di elaborazione superiore, gestendo diverse attività con una rapidità decuplicata. Secondo quanto riferito dai rappresentanti di Alibaba, la precisione e la qualità delle risposte di questa nuova generazione di modelli sono all’altezza della precedente ammiraglia, la Qwen3-235B-A22B. Questo miglioramento è stato perseguito per mettere a disposizione della clientela strumenti di IA che si possano implementare e utilizzare con efficienza anche su hardware destinato al consumo.
In aggiunta alla versione standard, Alibaba ha proposto una variante della sua IA progettata per il ragionamento avanzato. Denominata Qwen3-Next-80B-A3B-Thinking, questa implementazione supera non solo il suo predecessore diretto, la Qwen3-32B-Thinking, ma surclassa anche l’omologa di Google, Gemini-2.5-Flash-Thinking, in diversi test indipendenti, come affermato dagli sviluppatori di Alibaba.
L’azienda ha ottimizzato l'efficienza del nuovo modello attraverso una sintesi di diversi metodi innovativi. Tra queste tecniche, spicca l’utilizzo di un meccanismo di “attenzione ibrida”, un approccio che ha semplificato notevolmente l’elaborazione dei dati testuali in ingresso. Inoltre, l’implementazione di un’architettura basata sulla “miscela altamente sparsa di esperti” (MoE) ha permesso di suddividere il modello in sottoreti, ciascuna in grado di specializzarsi su set di dati specifici, lavorando all’unisono per risolvere complessi problemi in maniera collettiva. Un ulteriore miglioramento è rappresentato dalla strategia di “previsione multi-token”, così come una serie di misure adottate per incrementare la stabilità complessiva del modello nel corso del processo di apprendimento.
La Qwen3-Next-80B-A3B è già disponibile nell'infrastruttura Alibaba Cloud ed è accessibile tramite API. Gli utenti possono sperimentare questa nuova tecnologia anche su piattaforme di intelligenza artificiale come Hugging Face e ModelScope, ampliando ulteriormente le possibilità di applicazione e integrazione nei vari ambienti operativi. Alibaba, con questa innovazione, dimostra ancora una volta il suo impegno nel guidare il progresso nel settore dell'IA, offrendo soluzioni all’avanguardia sia in termini di prestazioni che di economicità.