Amazons Cloud-Ausfall: Der Blitz trägt keine Schuld

Vor etwa einer Woche sorgte ein Ausfall der Cloud-Dienste von Amazon dafür, dass zahlreiche Websites, die auf das Angebot des Online-Händlers setzen, nicht erreichbar waren. Jetzt wurde eine ausführliche Rekonstruktion der Vorfälle veröffentlicht. ... mehr... Blitz Blitz

Diese Nachricht vollständig anzeigen.

Jetzt einen Kommentar schreiben
 
Ich finde diese ganze Geschichte schon wirklich krass. Da schauen einige Berichte mittlerweile so aus, als ob fehlende Redundanzen für den Ausfall verantwortlich sind (die PLC waren wohl nicht redundant angelegt). Und das bei einem solch kritischen Bereich. Das lässt einen schon an der viel gelobten Sicherheit der ganzen Cloud-Idee zweifeln ... wenn man so für die Stabilität des Systems sorgt ... oder eben gewisse Redundanzen vernachlässigt.
 
@JoePhi: Naja, es wird niemals 100% Erreichbarkeit geben. NIEMALS. Du kannst alles 10fach absichern und dennoch passiert wieder irgendwas Unvorhergesehendes oder wie der Zufall es will sind zufällig alle 10 Absicherungen defekt. Möglich ist alles ;-)
 
@sushilange: das ist richtig. Aber dass Teile der Notversorgung nicht redundant angelegt werden, finde ich schon krass ... wenn man eben bedenkt was da dranhängt. Dann man hat ja gesehen was passiert, wenn das Teil ausfällt und die Server abschalten: Das dauert Tage bis der Kram wieder läuft ... da sollten die kritischen Komponenten doch auch in Gänze redundant exisitieren ... ich meine ...das machen wir ja sogar bei den popeligen paar dutzend Servern, die noch direkt hier rumstehen ... da existiert tatsächlich alles zweimal. Man muss ja nicht übertreiben und die redundaten Anlagen nochmal und nochmal redundant anlegen ... aber zumindest zweimal sollte der Kram schon exisitieren ... und das tat er wohl nicht ... zumindest bei dem System nicht, das die eine Notversorgung mit der anderen in Phase abgleicht ...
 
@JoePhi: Man kann aber nicht alles redundant sichern. Und so wie ich es verstanden habe, ist das genau hier der Fall. Irgendein System muss doch alles kontrollieren und dann die Notstromaggregate einschalten. Wenn du 2 solcher Systeme hast, wer steuert dann welches System zum Einsatz kommt? Da haste dann ja wieder nur ein System, was ausfallen kann.
 
@sushilange: na ja ... gerade Steuereinrichtungen sollten schon redundant vorhanden sein. Bei diesen Systemen hast du dann eine direkte Kommunikation zwischen den Systemen, wobei jedes der Systeme immer auf dem gleichen Stand, wie das andere ist. Das System A gibt im Normalfall den Ton an und System B übernimmt ohne Verzögerung, wenn von A in der direkten Kommunikation nix mehr kommt. Dass sowas auch anfällig ist, ist klar ... aber hier was ja die Phasensteuerung wirklich nur einmal vorhanden ... und das ist schon irgendwie seltsam.
 
@JoePhi: Davon abgesehen, dass man bei einer Cloud keinerlei Kontrolle mehr über seine eigenen Daten hat, zeigt dieser Vorfall doch wie unzuverlässig eine Cloud ist.
Bei einzelnen Diensten mag man über so einen Vorfall noch drüber weg sehen können, man stelle sich aber mal vor man hätte ein CloudOS. Man wäre total aufgeschmissen!
 
Wenns nicht der Blitz war, was war es dann? Konnte ich aus dem Artikel nicht herauslesen.
 
@karstenschilder: lt. anderen Berichten weiss das der Betreiber dieses Trafos, der da in die Luft geflogen ist, auch noch nicht und untersucht weiter. Aber der Blitz soll wohl daran nicht schuld gewesen sein ...
 
@karstenschilder: 2008, als die Wirtschaftskrise (die ja eigentlich immer noch da ist...) stärker in den Medien vertreten war und einige Banken Geldprobleme hatten und daher (oder wegen DM-Einführung) viele Geldautomaten lahmlegten, hieß es von offiziell immer, dass irgendwelche Tiere (Mader oder so) die Stromleitungen der Rechenzentren durchgekaut hätten ^^ (dass das völlig unmöglich ist, muss ich hoffentlich nicht näher erläutern).
 
@karstenschilder: na der Blitz nicht... das schöne an dieser Herangehensweise ist ja, dass man noch weitere News daraus klöppeln kann. "der Hausmeister wars nicht, der das Stromaggregat bei routinemässigen Kontrollen abschalten hätte können", "google wars auch nicht", "microsoft auch nicht" -
 
@Rikibu: Vor einer Woche hiess es noch der Blitz sei Schuld: http://goo.gl/RG7oF - Dieser Artikel ist also schon in Ordnung. :)
 
Es gilt weiterhin: ungesicherte Daten sind per Definition unwichtig. Insofern hat jeder selbst Schuld, der seine Daten einzig und alleine irgendwo "in die Cloud" wirft.
 
Gute Werbung für Cloud & Co. o.O
 
Na Gott sei Dank! Ich war schon kurz davor, den Blitz zu verurteilen.
 
Als ich mal schrieb dass die Cloud genau wegen solchen Sachen nicht empfehlenswert sei wurde ich mit Minussen abgestraft. Auch hab ich Bedenken wegen der Datensicherheit. Meine Daten sind auf meinen Festplatten immer noch am sichersten aufgehoben und ich brauche dann auch kein Internet um darauf zugreifen zu können.
 
@Traumklang: Is doch alles kein problem: Daten Redudant in die Cloud verschiedener Anbieter schicken und die Daten mit PGP verschlüsseln! :D Nee im ernst, einfach 2 Externe kaufen, Backup-Programm druff und ab damit. Is nicht sooo schwer... Deswegen gebe ich dir auch vollkommen recht, die Cloud is zwar komfortabel, aber wenns um die eigene Kontrolle geht hat man ein unüberwindbares Problem vor sich.
 
Mal wieder die Notstromversorgungen an allem schult. Da hat wohl der gleiche Hand angelegt wie der der die Notstromversorgungen in Atom Kraftwerken. Die ja alle richtig gut funktionieren!
 
jungs bitte.wenn ihr schon mit fachbegriffen um euch werft.dann nehmt auch bitte!!!! die deutschen begriffe dafür.ein plc heisst auf deutsch sps (speicherprogrammierbare steuerung).ich weiss wir benutzen in der deuschen sprache oft und viel anglizismen, aber ein wenig deutsch sollte man dann doch noch verwenden, vorallem bei dem in der (deutschen) industrie viel häufiger benutzten begriff sps.
Kommentar abgeben Netiquette beachten!