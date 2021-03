In der Nacht auf Dienstag sorgte ein massiver Microsoft-Ausfall dafür, dass zahl­reiche Dienste des Unternehmens wie Teams, Office und Outlook nicht erreichbar waren. Das hatte sogar Auswirkungen auf eine Film­pre­mi­ere. Mittlerweile ist (besser) bekannt, was dafür verantwortlich war.

Problem beim Key-Wechsel

Der jüngste Ausfall bei Microsoft bedeutete nicht nur, dass praktisch alle relevanten Dienste des Redmonder Konzerns nicht erreichbar waren, sondern hatte auch für Filmfans schwer­wie­gen­de Folgen: Denn die Freischaltung des von vielen Comic- und Filmfans sehn­süch­tig erwarteten Snyder-Cuts von Justice League musste um rund sechs Stunden ver­scho­ben wer­den, da die per Teams durchgeführte virtuelle Filmpremiere nicht stattfinden konnte.Ein derart massiver und weltweiter Ausfall führt natürlich sofort zur Frage nach dem Warum und diese beantwortet nun Mary Jo Foley teilweise. Denn die Microsoft-Spezialistin von ZDNet berichtet, dass der Redmonder Konzern eine erste Analyse veröffentlicht hat und mittlerweile näher sagen kann, was zum Azure Active Directory-Ausfall geführt hat.In den auf Azure Status History veröffentlichten vorläufigen Erkenntnissen heißt es: "Die vorläufige Analyse dieses Vorfalls zeigt, dass ein Fehler bei der Rotation von Schlüsseln auf­ge­tre­ten ist, die zur Unterstützung der Verwendung von OpenID und anderen Identitäts-Standard­pro­to­kol­len für kryptografische Signiervorgänge durch Azure AD eingesetzt werden."Microsoft erklärt, dass als Teil der "Standard-Sicherheitshygiene" ein automatisiertes System nach einem zeitbasierten Zeitplan Schlüssel entfernt, die nicht mehr verwendet werden. Der Key, der zu den Problemen geführt hat, wurde in den vergangenen Wochen zum "Beibehalten" (länger als vorgesehen) markiert, da er eine "komplexe Cross-Cloud-Migration" unterstützen sollte. Hier kam es aber zu einem Bug, da der Schlüssel, bei dem der Beibehalten-Status ig­no­riert wurde, entfernt wurde.Der Rollback wurde nach etwa zwei Stunden in die Wege geleitet. Das funktioniert allerdings nicht auf Knopfdruck, da die wiederhergestellten Metadaten erst langsam bei den einzelnen Anwendungen ankommen müssen - entsprechend dauerte der Ausfall Stunden. Microsoft will den Ausfall zum Anlass nehmen, um weitere Maßnahmen umzusetzen, damit das nicht erneut passiert.