Gli agenti di intelligenza artificiale (AI) che assistono nella scrittura di codice, come Anthropic Claude Code, non offrono garanzie di risultato al 100% e, in alcuni casi, possono verificarsi incidenti spiacevoli, come la cancellazione di dati. Tuttavia, nel caso dello sviluppatore Alexei Grigoriev, il colpevole non è stata l'AI, bensì un errore umano.
Lo sviluppatore aveva deciso di migrare il suo sito web nell'infrastruttura cloud di Amazon Web Services (AWS), dove era già presente un'altra sua risorsa. Claude Code aveva sconsigliato questa opzione, ma l'utente riteneva che mantenere due configurazioni separate fosse troppo oneroso. Per la gestione dell'infrastruttura, ha scelto l'utility Terraform, che supporta la creazione (e anche l'eliminazione) di risorse con tutte le impostazioni, incluse reti, bilanciamento del carico, database e i server stessi. Alexei ha chiesto a Claude Code di eseguire un piano Terraform per configurare il nuovo sito, ma ha dimenticato di caricare il file di stato con la descrizione completa della configurazione attuale.
Di conseguenza, l'agente AI ha eseguito il comando dello sviluppatore e ha creato un container per il sito da migrare, ma l'utente stesso ha interrotto il processo a metà. A causa dell'assenza del file di stato, le risorse hanno iniziato a duplicarsi. Lo sviluppatore ha quindi ordinato di identificare i duplicati delle risorse per correggere la situazione, e successivamente ha caricato il file di stato, ritenendo di aver compreso il problema. Alexei ha ipotizzato che l'agente AI avrebbe continuato a eliminare i duplicati delle risorse e poi avrebbe aperto il file di stato per capire come configurare la piattaforma. Avendo a disposizione il file di stato, Claude Code ha seguito le istruzioni di Terraform, eseguendo l'operazione "destroy" ("distruggi") per prepararsi all'installazione del sito. Considerando che nel file di installazione era presente un'altra risorsa, già presente in AWS, il risultato è stato la cancellazione di entrambi i siti, inclusa la banca dati con le registrazioni degli ultimi 2,5 anni e le sue istantanee, che venivano utilizzate come copie di backup. Per risolvere il problema, lo sviluppatore ha dovuto rivolgersi al supporto tecnico di Amazon, che è riuscito a ripristinare i dati entro 24 ore.
Descrivendo l'incidente, lo sviluppatore ha elencato diverse misure che ha adottato per evitare che simili situazioni si ripetano in futuro. Ha configurato un controllo periodico del ripristino del database, ha abilitato la protezione contro l'eliminazione in Terraform e AWS, e ha spostato il file di stato in un archivio S3 per non doverlo conservare sul proprio computer. Alexei ha ammesso di essersi fidato troppo dell'agente AI durante l'esecuzione dei comandi di Terraform, e ha deciso che in futuro eseguirà personalmente tutte le operazioni di eliminazione dei dati. Non ha ritenuto opportuno incolpare l'AI per l'incidente.
Questo incidente evidenzia l'importanza della supervisione umana, anche quando si utilizzano strumenti di intelligenza artificiale avanzati. Un approccio prudente e una profonda comprensione dei processi coinvolti sono essenziali per evitare la perdita di dati e garantire la sicurezza delle infrastrutture cloud. L'adozione di pratiche di backup robuste e la verifica periodica dei processi di ripristino sono inoltre fondamentali per mitigare i rischi.

