Un tragico incidente avvenuto a settembre in Australia ha portato alla luce gravi falle nel sistema di gestione degli aggiornamenti di Optus, un importante operatore di telecomunicazioni. Un aggiornamento difettoso del firewall ha causato un'interruzione del servizio di emergenza, impedendo a diverse persone di contattare il numero 000, equivalente al nostro 112, con conseguenze fatali. Inizialmente si era parlato di tre decessi, ma le autorità hanno confermato che due persone sono morte a causa dell'impossibilità di richiedere assistenza immediata.
L'indagine indipendente condotta da Kerry Schott ha rivelato una serie di errori tecnici e procedurali che hanno contribuito al disastro. Secondo il rapporto, i tecnici di Optus hanno commesso almeno dieci errori durante il processo di aggiornamento. Il 18 settembre 2025, per ben 14 ore, l'operatore non è stato in grado di garantire il corretto instradamento delle chiamate al servizio di emergenza. Ancora più grave, l'azienda non si è resa conto del problema fino a quando i clienti hanno iniziato a segnalarlo al call center.
Durante questo periodo critico, 455 chiamate al numero di emergenza 000 non hanno ricevuto risposta. L'analisi dell'incidente ha evidenziato una serie di negligenze, tra cui la mancata partecipazione di alcuni specialisti alle riunioni di valutazione dei rischi, l'eccessiva fretta nell'esecuzione dei lavori e l'impossibilità di controllare adeguatamente i risultati. Dei 18 aggiornamenti del firewall programmati, solo 15 sono stati completati senza problemi. Per il sedicesimo aggiornamento, Optus ha fornito istruzioni errate al suo fornitore, Nokia. Queste modifiche alla configurazione hanno causato l'isolamento dei dispositivi di rete e il blocco dell'accesso al gateway, impedendo il reindirizzamento del traffico. Questa procedura non era mai stata utilizzata da Optus nei sei precedenti aggiornamenti del firewall.
Inoltre, Nokia ha utilizzato una procedura obsoleta del 2022, inadatta per i lavori in corso. Gli ingegneri di Nokia hanno erroneamente ritenuto che gli interventi non avrebbero influito sul traffico di rete. Optus, dal canto suo, ha classificato i lavori come urgenti, rinunciando alle verifiche preliminari. Dopo l'aggiornamento, sia Nokia che Optus hanno rilevato anomalie nella rete, ma non vi hanno prestato sufficiente attenzione. Al termine dell'aggiornamento, i controlli finali hanno mostrato un aumento del tasso di errore delle chiamate, ma l'anomalia non è stata identificata. Infine, Optus ha utilizzato dati nazionali insufficientemente dettagliati per valutare le variazioni del volume delle chiamate, non riuscendo a rilevare i guasti locali causati dall'aggiornamento fallito.
L'esperto Kerry Schott ha concluso che le cause del disastro sono da attribuirsi alla cattiva gestione e alla scarsa qualità del lavoro di Optus e Nokia. Le procedure non sono state rispettate, i metodi di lavoro sono stati scelti in modo errato, i controlli sono stati insufficienti e le segnalazioni di allarme sono state ignorate. I tecnici di Optus si sono dimostrati troppo timidi nel chiedere aiuto a colleghi più esperti, privilegiando la velocità di esecuzione rispetto alla correttezza del lavoro. Le critiche più severe sono state rivolte ai team coinvolti nell'aggiornamento fallito, sottolineando come un simile errore durante un aggiornamento standard del firewall sia imperdonabile. È stata raccomandata una supervisione molto più rigorosa del personale e del lavoro di Nokia.
La vicenda non si è conclusa qui. Recentemente, è emerso che dalle reti degli operatori TPG, Optus e Telstra è impossibile chiamare il numero di emergenza 000 da alcuni smartphone Samsung con software obsoleto, causando almeno un decesso. Gli operatori australiani stanno cercando di reindirizzare il traffico durante i guasti, ma ciò è complicato dal fatto che diversi smartphone si comportano in modo diverso in caso di problemi. Optus raccomanda ai clienti di verificare la possibilità di chiamare il numero di emergenza 000 e tiene un elenco di dispositivi problematici. Tuttavia, i proprietari di dispositivi "grigi", acquistati online o all'estero, potrebbero incontrare difficoltà.
I guasti nei sistemi informatici sono frequenti e non sempre comportano solo problemi finanziari o tecnici. Ad esempio, nel luglio 2024, un guasto globale causato da un aggiornamento di CrowdStrike ha interessato 8,5 milioni di PC Windows. Un anno dopo, si è scoperto che almeno 750 ospedali negli Stati Uniti erano stati colpiti, anche se CrowdStrike ha criticato duramente la ricerca.


