Tutto bloccato, in tilt. Banche, ospedali, aeroporti, ferrovie, stazioni televisive, aziende le più diverse. Non è la trama dell’ultimo disaster movie ma il risultato di un aggiornamento di sicurezza per Windows andato male. Molto male.

I colpevoli sono due: un problema tecnico di Azure, il servizio cloud di Microsoft, e un errore di CrowdStrike, un provider di servizi di cybersecurity, che con un aggiornamento difettoso ha messo offline i PC e i server Windows che utilizzano il suo software, costringendoli in un ciclo di ripristino infinito.

Le manovre per farli ripartire non sono semplici: occorre riconfigurare un pezzo del sistema operativo eliminando fisicamente dei file e rigenerandoli. Un’operazione che qualche smanettone con Windows impallato può cercare di fare a casa sua, ma che nelle aziende richiede l’intervento di tecnici specializzati in presenza e rallenta tutto: occorreranno ore ed ore, in alcuni casi giorni (le stime sono che sino alla fine del fine settimana molti problemi persisteranno), prima di tornare alla normalità.

Lo schermo blu della morte viene dall’Est

L’aggiornamento buggato di CrowdStrike è stato rilasciato alle 04:09 UTC, cioè le 6:09 in Italia. I primi ad accorgersi di tutto sono stati gli australiani. All’avvio di Pc e server con Windows aggiornato durante la pausa pranzo hanno trovato il Blue Screen of Death (BSOD), il famigerato “schermo blu della morte”, che Windows da sempre mostra quando il sistema va in tilt. Mentre Sydney e Melbourne davano l’allarme il problema si è propagato sempre più verso Ovest. Dopo l’Australia è stato il turno dell’Asia, poi del Medio Oriente, dell’Europa e dell’Africa, per poi arrivare negli Usa e finire alle Hawaii e negli altri arcipelaghi del Pacifico che vanno verso il marcatore della data, la linea invisibile che divide il mondo tra “ieri” e “oggi”.

Non sappiamo ancora molto sulla dinamica ma CrowdStrike ha realizzato a tempo record una nuova versione dell’aggiornamento priva del problema. Ma questo però aiuta solo chi non aveva ancora fatto l’aggiornamento del suo sistema, che ora è sicuro. Invece, chi aveva già aggiornato e aveva visto il suo Pc con lo schermo blu e bloccato in un ciclo di riavvii senza fine, ha avuto bisogno di risolvere il problema “a mano”.

Intanto, sono andati in tilt con lo schermo blu decine e decine di grandi infrastrutture. Aziende come banche, società di telecomunicazioni, emittenti radiotelevisive e supermercati di tutto il mondo hanno segnalato di essere K.O.. Anche le compagnie aeree sono state colpite: i voli delle compagnie statunitensi, tra cui American Airlines, Delta e United Airlines negli Usa, sono stati bloccati. Anche gli aeroporti in Germania e Spagna hanno segnalato problemi. Ryanair ha avvertito che i suoi sistemi sono stati impattati e ci sono “problemi sostanziali”. Alcune compagnie aeree che volano nel nostro Paese, come Wizz Air, hanno consigliato ai clienti di recarsi ai banconi per fare check-in gratuitamente con “almeno tre ore di anticipo”: si prevedo code epocali perché il check-in online non funziona.

Ryanair_blackout

Caos negli aeroporti

Gli aeroporti italiani sono stati “toccati” dal problema indirettamente: non sono andati in crash i sistemi ma la circolazione si è interrotta perché alcuni dei grandi aeroporti europei e mondiali non potevano più far partire o ricevere i voli. Si è inceppato il sistema e di conseguenza anche gli scali italiani Tra i più colpiti ci sono Atlanta, negli Stati Uniti (il più grande scalo al mondo), Schiphol nei Paesi Bassi e alcuni scali asiatici.

In molti aeroporti ci sono stati tilt parziali, oppure hanno smesso di funzionare i sistemi legati al cloud: gli scanner automatici per l’imbarco sono andati fuori uso, e il personale è stato costretto a controllare le carte d’imbarco manualmente. L’aeroporto Schiphol di Amsterdam ha dichiarato: “È in corso un guasto al sistema globale. Questa interruzione ha un impatto anche sui voli da e per Schiphol. L’impatto è ora in fase di mappatura”. L’aeroporto Brandeburgo di Berlino ha dichiarato che “a causa di un guasto tecnico, ci saranno ritardi nel check-in”.

La rabbia e l’ironia di Reddit

Sul fronte del cloud di Redmond le cose sono andate solo leggermente meglio, perché i problemi sono stati risolti più velocemente. Mentre Microsoft stava tentando di risolvere i problemi con le sue app e servizi cloud 365, che hanno messo brevemente in ginocchio diverse aziende anche nel cloud, gli utenti di Reddit si sono scatenati raccontando di intere imprese offline e c’è anche chi ha scherzato augurandosi “un buon venerdì”. Per molti purtroppo il fine settimana si sta trasformando in un lunghissimo weekend di lavoro per riparare i danni.

Anche SkyNews è in tilt
Anche SkyNews è in tilt

Il rischio della monocultura

Incidenti di questo tipo possono capitare, ovviamente, ma al di là del singolo intoppo c’è un problema più ampio. Non solo dipendiamo sempre di più dalla tecnologia per la vita di tutti i giorni, ma facciamo anche alcuni errori di impostazione nel mondo con la quale la utilizziamo.

Alcuni anni fa gli esperti di cybersecurity come il guru Bruce Schneier avevano avvertito dei rischi della cosiddetta “monocultura”: se tutti o la maggior parte dei sistemi utilizzano la stessa piattaforma, in questo caso Windows, basta un errore, un virus o un problema qualunque perché vengano giù uno dopo l’altro tutti i sistemi. Una monocultura informatica si traduce in una diversità tecnologica molto limitata e quindi in una resilienza inferiore.

Tuttavia, poteva andare peggio. Il tilt provocato da CrowdStrike da un lato sta creando problemi perché dimostra quanto la nostra società sia dipendente da Internet e dai computer. Dall’altro però gli effetti sono relativamente contenuti perché non viviamo più, come negli anni Novanta e Duemila, in un mondo “monoculturale” centrato su Windows. Invece, c’è una crescente diversità grazie a Unix, Linux e macOS, oltre ai sistemi mobili (Android, iOS, iPadOS) che sono diversi da Windows e non sono colpiti.

Insomma, quando si parla di tecnologia la diversità fa solo bene e la giornata di venerdì, che passerà alla storia come il “venerdì nero” dell’informatica, poteva in realtà andare molto peggio se non avessimo avuto così tanti sistemi alternativi.