Anthropic, influente azienda nel settore dell'intelligenza artificiale, ha recentemente presentato il suo ultimo gioiello: Claude Sonnet 4.5. Questa nuova versione rappresenta l'apice delle grandi modelli linguistici nel panorama di Claude e punta a essere un punto di riferimento nel campo della programmazione, della creazione di agenti IA e della risoluzione di problemi complessi.
Secondo fonti interne all'azienda, Claude Sonnet 4.5 non solo si pone come leader nei benchmark specifici del settore, ma compie un notevole salto di qualità nella comprensione del codice programmatico, nei calcoli matematici e nella gestione del computer. La sua superiorità è già evidente nel SWE-bench Verified, un test industriale che misura la competenza delle IA nel creare e analizzare codice. Infatti, Sonnet 4.5 dimostra una capacità di concentrazione di oltre 30 ore, superando di gran lunga le sue precedenti versioni e i competitor più vicini.
Nei test di OSWorld, rivolti a valutare le prestazioni su reali compiti informatici, Claude Sonnet 4.5 ha ottenuto un risultato del 61,4%, ben al di sopra del 42,2% della versione precedente, Claude Sonnet 4. Questa scala di miglioramento nelle prestazioni in pochi mesi è impressionante e testimonia il dinamismo dell'innovazione software della società.
Il potenziale di questa nuova IA non si limita solo alla programmazione. Test sia interni che indipendenti hanno dimostrato progressi significativi nella risoluzione di problemi logici, matematici, nonché una competenza crescente in aree specializzate come finanza, medicina, diritto e discipline STEM. Gli sviluppatori evidenziano un miglioramento nell'analisi del codice, nella gestione dei documenti e nei calcoli complessi in tempo reale.
Particolarmente notevole è la modalità sperimentale Imagine with Claude, che consente all'IA di generare soluzioni software in tempo reale, adattando il codice alle richieste immediate degli utenti.
Contestualmente al lancio di Sonnet 4.5, Anthropic ha rilasciato significativi aggiornamenti per l'ecosistema Claude. Sono stati introdotti nuovi checkpoint per salvare i progressi nel servizio Claude Code, un terminale aggiornato e una nuova estensione nativa per Visual Studio Code. Le nuove applicazioni Claude ora permettono di lavorare direttamente sul codice, creare file, incluse tabelle, presentazioni e documenti in dialogo diretto con l'IA. Gli utenti con abbonamento Max possono beneficiare di un'estensione per Chrome.
Anthropic ha inoltre annunciato la disponibilità di un nuovo set di strumenti per gli sviluppatori: il Claude Agent SDK. Questo consente la creazione di agenti intelligenti personalizzati basati sulle stesse tecnologie di Claude Code. L'SDK apre la strada alla realizzazione di soluzioni avanzate, gestendo memoria, diritti e coordinando le sottocompiti tra diversi agenti.
Uno dei tratti distintivi di Claude Sonnet 4.5 è anche la sua ridotta tendenza a comportamenti pericolosi o indesiderabili, come assecondare l'utente, tentare di aggirare le restrizioni o rispondere a richieste nocive. Anthropic ha implementato dei filtri a più livelli (AI Safety Level 3), specialmente per tematiche legate a armi chimiche, biologiche, nucleari e altro. Questo rende il nuovo modello non solo efficiente, ma anche sicuro, con un tasso di falsi positivi decuplicato rispetto alle precedenti versioni.
Claude Sonnet 4.5 è già disponibile per tutti mediante la versione web del chat-bot e nelle applicazioni mobili, con la possibilità di accesso attraverso API a prezzi in linea con le versioni precedenti, partire da 3 dollari per milione di token. Le nuove opzioni di Claude Code e l'Agent SDK sono accessibili a tutti gli sviluppatori e i clienti aziendali, promettendo di trasformare in profondità l'approccio alla programmazione e alla gestione dell'intelligenza artificiale nel prossimo futuro.