Interrupção do Facebook causada por um único erro; tem grandes implicações

A interrupção do Facebook de ontem - que derrubou o Facebook Messenger, Instagram e WhatsApp , bem como o serviço principal - resultou de um erro dos próprios engenheiros de rede da empresa.
O erro fez com que todos os serviços do Facebook ficassem inacessíveis, com uma analogia comparando-o a uma falha nos serviços de “controle de tráfego aéreo” para tráfego de rede ...
Aos poucos, pareceu que o problema poderia estar relacionado ao DNS - os servidores de nome de domínio que informam aos dispositivos quais endereços IP usar para acessar os serviços - mas não estava claro o que exatamente havia acontecido e se era um hack externo, ação mal-intencionada de um insider, ou um erro catastrófico.
O Facebook agora admitiu em um blog que foi um erro.
Nossas equipes de engenharia aprenderam que as alterações de configuração nos roteadores de backbone que coordenam o tráfego de rede entre nossos data centers causaram problemas que interromperam essa comunicação. Essa interrupção no tráfego de rede teve um efeito cascata na maneira como nossos data centers se comunicam, interrompendo nossos serviços.
Demorou muito para resolver o problema porque os sistemas inacessíveis incluíam os servidores e as ferramentas que os engenheiros normalmente usariam para resolver o problema remotamente. Os relatórios sugerem que os funcionários de nível inferior tiveram que obter acesso físico aos data centers e, em seguida, confiar nas instruções passo a passo de engenheiros mais experientes para desfazer o erro. Para complicar ainda mais, a indisponibilidade das redes significava que os sistemas de acesso à porta do Facebook também estavam offline, impedindo fisicamente o acesso.
Crie seu link do WhatsApp gratis
Sem cadastro, com mensagem automatica e QR Code. Menos de 30 segundos.