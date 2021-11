WhatsApp, Facebook, Instagram e Messenger, le infrastrutture social dell’ecosistema di Mark Zuckerberg, sono state irraggiungibili per diverse ore, cerchiamo di dare una spiegazione a quello che può essere successo

WhatsApp Facebook e Instagram down per oltre 5 ore. Precisamente dalle 17,40 le tre piattaforme sono diventate inaccessibili in tutto il mondo. Poi poco prima dell’una di notte (ora italiana) hanno ripreso lentamente a funzionare. Ma cos’è successo? La spiegazione arrivata a caldo è stata quella del vicepresidente delle infrastrutture di Facebook, Santosh Janardhan. Il prolungato down e quindi la totale impossibilità di operare sui tre social network è stato provocato da modifiche alla configurazione dei router che hanno portato a una interruzione del traffico di rete.

La prima spiegazione ufficiale. Il blackout mondiale che ha colpito Facebook e le sue app Instagram e WhatsApp è stato provocato da modifiche alla configurazione dei router che coordinano il traffico di rete tra i suoi centri dati. “Questa interruzione del traffico di rete ha avuto un effetto a cascata sul modo in cui comunicano i nostri centri dati, bloccando i nostri servizi“,

WhatsApp Facebook e Instagram down, cos’è successo

Proviamo a dare una spiegazione in sintesi di quello che può essere accaduto al complicato sistema di router di Facebook che ha provocato il down generale. Nei sistemi di telecomunicazioni e informatica esistono delle reti cosiddette di “vicinanza” chiamate BGP (Border Gateway Protocol) un protocollo di routing di tipo EGP usato per connettere tra loro più router che appartengono a sistemi autonomi.

Quindi un protocollo di instradamento (routing) che agisce sul ‘bordo’ della rete Internet. Il BGP funziona attraverso la gestione di una tabella di reti IP, o prefissi, che forniscono informazioni sulla raggiungibilità delle diverse reti tra più sistemi autonomi. Si tratta di un protocollo di routing a indicazione di percorso (path vector), che non usa metriche di carattere tecnico ma prende le decisioni di instradamento basandosi su politiche (regole) determinate da ciascuna rete.

Se il vero problema, così come dichiarato dalla società, fosse collegato a questo sistema, la causa sarebbe da circoscrivere proprio alla rete BGP al quale collegato il sistema di router di Facebook. In sostanza si sarebbero auto esclusi dalla rete per un aggiornamento andato “storto” di uno dei router della complicata ed enorme rete di Menlo Park. Gli indirizzi IP dei server si sarebbero dunque persi. La rete non era più a conoscenza dell’esistenza di Facebook in soldoni.

Per fare un esempio alla portata di tutti. Pensate di avere un’auto a guida autonoma che è connessa e si muove tramite Google Maps. Conosce esattamente ogni luogo dove la indirizziamo. Ma ad un certo punto scompare da Google Maps un Corso Sempione a Milano, piuttosto che via Nomentana a Roma e lui in quel punto, se noi gli diciamo di portarci, non ci arriverà mai. Perché non esiste più.

Inoltre, la cosa assurda accaduta è che i tecnici stessi chiamati a risolvere il problema non erano in grado di dialogare con i Data Center poiché i loro strumenti di utilizzo erano in blackout. In sostanza, tutti i dipendenti avevano gli applicativi down in quanto utilizzavano (e utilizzano) tutti servizi creati ad hoc all’interno del macro sistema Facebook.

E la cosa buffa, da quanto si è appreso, è che nemmeno il sistema dei badge dei dipendenti veniva riconosciuto. L’autenticazione è evidente sia quindi sul dominio Facebook quando avviene il riconoscimento del documento d’ingresso c’è un sistema di autenticazione collegato alla rete internet che dialoga con i server di Facebook stesso.

Le ragioni di un guasto senza precedenti nella storia dei social network gestiti da Mark Zuckerberg restano ancora però non del tutto chiare.

