Hardware-Ausfall legt populäre Webseiten & andere Dienste lahm

In sozialen Netzwerken lief die Gerüchteküche in Sachen Ursache am Samstagvormittag heiß: Viele populäre Webseiten wie "Spiegel Online" und "wetter.com" waren über Stunden nicht erreichbar, auch O2 hatte mit Problemen zu kämpfen. mehr... Sicherheit, Hacker, Netzwerk Bildquelle: Axel Schwenke / Flickr Sicherheit, Hacker, Netzwerk Sicherheit, Hacker, Netzwerk Axel Schwenke / Flickr

Diese Nachricht vollständig anzeigen.

Jetzt einen Kommentar schreiben
 
"Demnach sei bei einem Provider in der IT-Anlage in Nordrhein-Westfalen zunächst der Strom ausgefallen. "

Ja ne is klar! Rechenzentren haben genau für solche Notfälle eine mehrfache redundante
Notfall-Stromversorgung mit Dieselgeneratoren usw.
Bei Pannen im Stromversorgungsnetz erlauben Generatoren für locker 48 Stunden einen autonomen Betrieb.
 
@McMOK: Das dachten Anlagenbetreiber anderer technischer Einrichtungen auch und vernachlässigten die Wartung, mit ähnlichen Folgen.

Von den Membern von WF.de stand wohl niemand daneben und hat zugeschaut, wie die Lichter ausgegangen sind. Spekulieren kann man da auch noch Jahre später... Am Ende hat nur irgend Schwachmat die Starkstromleitungen kurz geschlossen - da hilft dann auch keine Redundanz mehr.
 
@Diak: Das gleichzeitig der Strom aus dem normalen Netz und der USV-Strom ausfällt kann man aber als sehr sehr unwahrscheinlich betrachten. Also hat man entweder Schrotthardware mit nur einem Netzteil verbaut oder möchte nur von der wahren Ursache ablenken.
 
@leipziger1991: Spekulationen bringen da aber wenig ein. Bestenfalls hat man dann Jahre später noch was zum Diskutieren à la 9/11 oder den 'Mondlandungen', schlimmstenfalls führen Spekulationen zu realitätsfernen Annahmen&Handlungen oder gar Paranoia. Gut, in dem Fall wohl eher nicht.

Kritisches Hinterfragen ist ja okay, aber nur weil man nichts genaues weis, muss man da nicht gleich einen Hoax darum konstruieren; was leider mehr oder minder überall aufkommt... Es ist schlicht nervig.
 
@Diak: angeblich soll anonymous dafür verantwortlich sein ... Wird gemunkelt...
 
@leipziger1991: Sicherlich könnte es durchaus sein, dass hier von der wahren Ursache abgelenkt werden soll, aber meine Erfahrung aus der Industrie zeigt mir, dass es eher unwahrscheinlich ist.

Es ist leider heute Normalität, dass an allen Ecken und Enden gespart wird. Sei es bei der Hardware, bei der Wartung, beim Personal bzw. deren Weiterbildung/Schulung usw. Das ist heute leider Gang und Gäbe, und eher die Regel als die Ausnahme!

Deswegen halte ich es tatsächlich für realistischer, dass Schrotthardware daran schuld war bzw. mangelnde Wartung.
 
@seaman: Dann bin ich wohl in meiner Firma doch etwas verwöhnt. Bei uns wird regelmäßig geplant der Netzstrom abgeschaltet und dann geht's ab in den Serverraum checken ob alle Kernsysteme noch von USV/Dieselgenerator betrieben werden um genau die Ursache Stromausfall für Probleme auszuschließen.
 
@leipziger1991: Verwalte einen kleinen Serverraum im Herzen von München. Hier war vor etwa 1-2 Jahren eine Stunde komplett der Strom weg, in der ganzen Gegend. Sowas gab es seit Jahrzehnten nicht mehr. Kommt sehr selten vor, aber unmöglich ist sowas nicht.
 
@Diak: Es ist sehr unwahrscheinlich, dass ein Rechenzentrum derart unprofessionell aufgebaut ist. In einem (größeren) Rechenzentrum hat man selbstverständlich mehrere getrennte Stromkreise und jeder Server ist mindestens an 2 Stromkreise angeschlossen. Ebenso hat man mehrere Kühlkreisläufe, so dass die Kühlung nicht zum Single Point of Failure wird. Daneben gibt es immer, sogar in kleinsten Rechenzentren, USVs, die die Stromversorgung kurzzeitig sicherstellen. Zusätzlich springen dann z.B. Dieselgeneratoren an, die einen dauerhaften Betrieb gewährleisten können. Ei Ausfall verursacht derart große Kosten, dass dies für jeden Betreiber eines Rechenzentrums zum grundlegenden KnowHow gehört.
 
@McMOK: Wem kann man denn noch glauben ?, mir fällt da vllt mein Freundeskreis ein und den Rest kann man in die Tonne treten.
 
@McMOK: bringt aber nix wenn die Hardware denoch hopps geht. ich habe es auch so erleben dürfen in der uni, die komplette IT hängt an einer dicken vfi von apc und dann ist der Strom ausgefallen. kein Problem alles lief bis auf 10 Server die komplett ausgestiegen sind. nach ausreichender Prüfung von dell sind bei diesen 9 Servern Bauteile im Netzteil kaputt gegangen, bei einem blade der Prozessor, Auslöser war die kurze Schwankung im Stromnetz. Was ja ausgegelichen wird von der usv aber es reicht eben aus.
 
Im Netz liest man aber was anderes...
 
@eleCtr00nix: Hab ich mir auch gedacht ;-)
 
@eleCtr00nix: Kannste mal sehen, was für einen Schwachsinn man manchmal "im Netz" zu lesen bekommt...
 
@eleCtr00nix: welches Netz? ist doch ausgefallen!
 
@eleCtr00nix: na wenn's "im Netz" steht muss es ja wohl stimmen...
 
Da ich leider noch O2 Kunde bin kann ich zumindest die Mobilfunk Ausfälle nicht bestätigen wobei mein Gerät auf E-Plus (O2-DE+) Umgeschaltet hatte mein Festnetz war allerdings auch Gestern komplett Ausgefallen.
 
nja mein gott passiert halt mal. hat der putzfrai keiner gesagt das sie die kabel nicht rausziehen soll ?
 
@Tea-Shirt: Erinnert an diese blöde Werbung von vor hundert Jahren... Kein Ahnung, von wem die war... '...der Drucker druckt nicht! - Schonmal am Kabel gewackelt?' ^^
 
Schade das die Volksverhetzer von Springer nicht dabei waren.
 
Als Spiegel und Focus nicht mehr ging, hatte ich schon die Hoffnung, dass die endlich tot sind und auch nach den anderen Wahrheitspressen geschaut, die leider noch da waren.
Leider wars dann doch noch nicht Weihnachten, Ostern und Geburtstag.
 
Frag mich warum so scheinbar kritische Dienste nicht wie z.B. bei den Amazon Web Services auf verschiedene Availability Zones verteilt werden?
 
@xploit: Auch bei AWS gab es schon merfach mehrstündige Downtimes.
 
@Doso: Mit Sicherheit nicht, wenn du deine Server auf verschiedene AZ oder sogar Regions verteilt hast. Und wenn, dann war DNS schuld und nicht AWS. Aber berichte mir gerne von deinen Erfahrungen.
 
stellt man die USV eigentlich nicht so ein, dass ein kontrolliertes Herunterfahren der Server gewährleistet ist?
(Ich weiss, gewisse Server haben bis zu 15 Min beim Herunterfahren, wegen Services etc.)

Zum anderen, bei grossen Seiten sollte es doch eine gewisse Server-Redundanz geben, oder vielleicht ein Snapshot der Seiten, oder nicht?
 
@AlexKeller: Wir haben es so konfiguriert, weil wir mit entsprechender Downtime leben können. Denke aber große Datencenter werden das eher vermeiden und überbrücken bis die Generatoren anlaufen. Selbst bei tausend Sicherungen hat man immer noch ein Restrisiko, und manchmal hat man halt einfach Pech.
 
@Doso & @xploit: Danke für die Infos!
 
@AlexKeller: kommt drauf an, auf welchem Professionalitäts-Level du dich bewegst. Als kleiner halb-privater Provider kümmerst du dich vielleicht noch um deine USV, aber sobald du das geschäftlich betreibst, nutzt du mindestens verschiedene Brand- bzw. sogar regionale Zonen.
 
Hmm bei Spiegel hatte sich das ja angekündigt. Die Mobile Website war die letzten Tage öfter mal nicht abrufbar.
 
Ist mir unbegreiflich. Wenn ich als Provider Webseiten wie spiegel.de und focus.de hoste, dann muss ich eine entsprechende USV und eine NEA haben. Sowas haben heutzutage schon mittelständige IT-Unternehmen.
Ich glaub nicht so richtig daran.
 
@red.sixx: Darf ich fragen was Du beruflich machst? Fachfremde haben oftmals keine realitätsnahe Vorstellung davon, wie's in anderen Branchen wirklich zugeht, und dann erscheint ihnen vieles "unbegreiflich".
 
"Im Netz waren im Zuge der Ausfälle schnell Gerüchte laut geworden, ein geplanter Angriff können die Ursache für diese weitreichenden Probleme sein."...omg. Ich glaube die meisten die das denken und schreiben haben absolut keinen Schimmer wie das netz eigentlich aufgebaut ist oder? Es sind halt Webserver, die ONLINE sein müssen, um somit ihre Dienste bereitzustellen. Aber ok die meisten wissen ja noch nicht mal was ne IP ist bzw. das man sich erstmal mit dem Netz verbinden muss, auch wenn es heutzutage anders läuft als noch zu modem-Zeiten. Das gleiche gilt natürlich auch für Webserver & Dienste. Man ist halt einfach online (denken zumindest viele) und das finde ich schon erschreckend.
 
Ich hab auch einen kompletten Ausfall eines großen Provider-RZ (in Düsseldorf) miterleben dürfen.
Bei einem Testlauf (!) sollte die Netzeinspeisung von den Energieversorgern (!) abgeschaltet werden, um zu sehen ob die USV-/Dieselanlagen hochlaufen.
Dumm war nur, dass die Schalter dazu falsch beschriftet waren (wirklich!). Der Kollege hatte dann tatsächlich den "RZ-Notaus" erwischt (ja den gibt es wirklich). Bingo, schlagartig war alles dunkel. Da springt auch keine USV oder ein Diesel an. Ist ja schließlich "Not-Aus" :-)
Sofort steigt die Wärme im RZ und vor allem im Kern erheblich an. Da müssen erst nach und nach die Klimaanlagen hochgefahren und dann ein Rack nach dem andren in Betrieb genommen werden. Das dauert dann schon mal einige Stunden, bis alles wieder rund läuft. Und das ohne technischen Defekt!
Also was lernen wir daraus:
1.) totale Sicherheit gibt es nirgends
2.) Deppen gibt es überall
3.) aus einer kleinen "Mücke" wird durch entsprechende Medienwirksamkeit gerne mal ein "großer Elefant"
4.) glaubt bloß nicht alles was erzählt wird (außer mir :-) .

Die Frage in diesem Fall ist nur, warum die wichtigsten Server nicht über mehrere Standorte als Cluster gefahren werden. So wird das bei uns (im Bankenumfeld) gemacht. Da merkt man bestenfalls gar nicht, dass ein Standort ausgefallen ist (außer Murphy schlägt zu).
Kommentar abgeben Netiquette beachten!

Video-Empfehlungen

WinFuture Mobil

WinFuture.mbo QR-Code Auch Unterwegs bestens informiert!
Nachrichten und Kommentare auf
dem Smartphone lesen.

Folgt uns auf Twitter

WinFuture bei Twitter

Interessante Artikel & Testberichte

WinFuture wird gehostet von Artfiles