Un'estesa interruzione di Amazon Web Services (AWS) ha provocato un'ondata di disservizi che ha colpito numerose piattaforme e servizi online, lasciando molti utenti negli Stati Uniti e nel mondo alle prese con malfunzionamenti e inaccessibilità. Tra i servizi più noti coinvolti figurano Amazon stessa, Alexa, Snapchat, Fortnite, ChatGPT, Epic Games Store, Epic Online Services, Perplexity, Airtable, Canva e persino l'app di McDonald's.
Il problema è emerso poco dopo la mezzanotte del Pacific Daylight Time (PDT). Amazon ha prontamente identificato la causa un paio d'ore dopo e ha comunicato di star monitorando il ripristino graduale della maggior parte dei servizi. La società ha precisato che le problematiche si sono concentrate nella regione US-EAST-1, ma che in alcuni casi gli impatti si sono estesi a livello globale. L'indagine preliminare ha indicato che la radice del problema risiedeva nella risoluzione DNS dell'endpoint API DynamoDB nella regione US-EAST-1. Questo guasto ha avuto ripercussioni anche su altri servizi AWS nella stessa regione. Servizi globali o funzionalità che dipendono da endpoint US-EAST-1, come gli aggiornamenti IAM e le tabelle globali DynamoDB, hanno subito analoghe interruzioni.
In un aggiornamento successivo, Amazon ha dichiarato di aver risolto completamente il problema DNS sottostante e che la maggior parte delle operazioni dei servizi AWS stavano tornando alla normalità. Tuttavia, l'azienda ha avvertito che alcune richieste potrebbero essere temporaneamente limitate durante il completamento del ripristino. Inoltre, alcuni servizi stavano ancora smaltendo un arretrato di eventi, come Cloudtrail e Lambda. Nonostante il recupero generale, le richieste di avvio di nuove istanze EC2 (o servizi che le avviano, come ECS) nella regione US-EAST-1 continuavano a registrare tassi di errore elevati. I tecnici di Amazon hanno assicurato di essere al lavoro per una risoluzione completa.
Contemporaneamente al blackout di AWS, anche tre servizi di Apple hanno subito una grave interruzione. Lo stato del sistema Apple indicava problemi risolti per Apple TV, Apple Music e App Store, dopo che numerosi utenti si erano trovati nell'impossibilità di effettuare streaming su Apple TV, ascoltare la propria libreria su Apple Music o scaricare nuove app dall'App Store. Al momento, non è chiaro se i due eventi siano collegati, ma la concomitanza temporale e la risaputa dipendenza di Apple da AWS per alcuni dei suoi servizi lasciano aperta questa possibilità. Un'indagine approfondita dovrà accertare se si tratta di una semplice coincidenza o se esiste una correlazione tra i due blackout.
Questi eventi dimostrano quanto la nostra vita digitale sia interconnessa e dipendente da un'infrastruttura cloud apparentemente invisibile. Quando un pilastro di questa infrastruttura come AWS cede, le conseguenze possono essere immediate e diffuse, impattando su milioni di utenti e su una vasta gamma di servizi che diamo per scontati. Episodi come questo sottolineano l'importanza della resilienza, della ridondanza e della diversificazione delle infrastrutture cloud, nonché della necessità di piani di emergenza efficaci per mitigare i rischi e minimizzare i disagi in caso di interruzioni.
Il blackout di AWS e i problemi di Apple ci ricordano anche la vulnerabilità del nostro ecosistema digitale e la necessità di una maggiore consapevolezza da parte degli utenti. Affidarsi ciecamente a un singolo fornitore di servizi cloud può esporre a rischi significativi, mentre una maggiore diversificazione e una strategia di backup adeguata possono contribuire a proteggere i dati e garantire la continuità operativa in caso di eventi imprevisti. In un mondo sempre più dipendente dal cloud, la resilienza e la sicurezza dell'infrastruttura digitale sono diventate priorità assolute.
Prima di procedere


