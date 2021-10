Facebook hat sich nach dem weitreichenden und stundenlangen Ausfall seiner Portale und der Dienste Instagram und WhatsApp ausführlicher zu den Gründen geäußert. Wie vermutet waren Fehler in der Konfiguration der Router in Facebooks Datenzentren die Ursache.

Ausfall betraf Milliarden Menschen

Facebooks Vice President of Engineering and Infrastructure erklärte in einem Eintrag im Weblog des Netzwerk-Teams , dass man bei der Untersuchung des Vorfalls festgestellt habe, dass Änderungen an der Konfiguration der Backbone-Router im internen Netzwerk zwischen den Facebook-Rechenzentren Probleme verursacht hätten, die deren Kommunikation unterbrachen.Der Ausfall des Netzwerk-Verkehrs habe sich dann auf die Kommunikation der Rechenzentren untereinander ausgewirkt, wodurch die Dienste von Facebook, Instagram und WhatsApp ausfielen. Mittlerweile sind die Services wieder online und man arbeite daran, sie wieder in vollem Umfang auf normale Weise laufen zu lassen.Es habe sich eindeutig um einen Fehler bei der Änderung der Konfiguration gehandelt und keine Nutzerdaten seien durch den Ausfall abgegriffen worden. Facebook arbeite nun daran, seine Dienste weniger fehleranfällig zu machen und die Infrastruktur entsprechend anzupassen. Der Ausfall betraf letztlich rund 3,5 Milliarden Menschen, zumal viele Nutzer heute kaum noch per Telefon oder SMS kommunizieren und ihre Interaktion voll zu Messengern wie WhatsApp verlagert haben.Der Dienstleister Cloudflare, der auch den DNS-Dienst 1.1.1.1 betreibt, hat in einem Blog-Eintrag ausführlichere Informationen zu den Problemen bei Facebook veröffentlicht. Dort heißt es, dass Facebook wohl Fehler in der Konfiguration des Border Gateway Protocols (BGP) bei den internen Routern gemacht habe, die dafür sorgten, dass die Rechenzentren des Konzerns nicht mehr auf normale Art und Weise kommunizieren konnten.Deshalb waren sie stundenlang nicht von außen erreichbar und es kam obendrein wegen einer in Folge des Ausfalls erhöhten Anzahl von Anfragen durch Internet-Nutzer teilweise zu einer Überlastung der DNS-Infrastruktur des Internets. Dass es so lange dauerte die Probleme in den Griff zu bekommen, führt Facebook übrigens darauf zurück, dass der Ausfall der Dienste auch die Werkzeuge und Systeme betraf, die das Unternehmen zur Wartung seiner Infrastruktur nutzt. Es sei daher schwerer gewesen, schnell eine Lösung umzusetzen.