X

Bericht: 43 Sekunden, die zum ganztägigen Github-Ausfall führten

Github hat nach seinem Ausfall von vor eineinhalb Wochen eine ausführliche Analyse zu den Ereignissen veröffentlicht. Darin erklärt Senior Vice President Jason Warner, wie ein noch nicht einmal einmütiger Ausfall einer wichtigen Verbindung letzten Endes die Plattform für viele Nutzer für einen ganzen Tag nahezu unbrauchbar machte.
31.10.2018  11:33 Uhr
Github ist seit kurzem ganz offiziell ein Teil von Microsoft. Zu der neuen Philosophie des Unternehmens gehört es nun auch, viel transparenter als zuvor über die Plattform zu berichten. So gibt es jetzt einen öffentlichen Report über die Ereignisse, die zu dem großen Ausfall von Github vom 21. zum 22. Oktober führten (via Geek Wire).

Verbindung offline

Bekannt war bereits, dass die routinemäßige Wartung fehlgeschlagen war. Dadurch war eine wichtige Verbindung zwischen den GitHub-Infrastrukturgeräten 43 Sekunden lang offline, erläutert Jason Warner jetzt in dem im Github-Blog verfügbaren Beitrag.

Dieser Ausfall in den Verbindungen konnte zwar schnell behoben werden, er verursachte aber eine Kaskade von weiteren Problemen. Die Github-Ingenieure erkannten laut Warner dann sehr schnell, dass der Ausfall inkonsistente Benutzerdaten verursacht hatte.

Lang und sicher

Dadurch sah man sich vor einem weiteren Problem: Sollte man eine schnelle Wiederherstellung nutzen, die sehr wahrscheinlich einen Teil der Benutzerdaten zerstören würde, oder sollte man den langen Wiederherstellungsprozess wählen, der zwar lang dauern würde, aber alle Daten retten könnte. Github entschied sich für den zweiten Weg, verpasste es aber zeitnah, das auch so mitzuteilen.

Nun entschuldigt sich Warner im Namen von Github:

"Mit diesem Vorfall haben wir Sie enttäuscht, und es tut uns zutiefst leid. Während wir die Probleme nicht rückgängig machen können, die dadurch entstanden sind, dass die Plattform von GitHub über einen längeren Zeitraum hinweg nicht nutzbar war, können wir die Ereignisse erklären, die zu diesem Vorfall geführt haben, die Lehren, die wir gezogen haben, und die Schritte, die wir als Unternehmen unternehmen, um sicherzustellen, dass sich dies nicht wiederholt."

Verwandte Themen
Microsoft Corporation
☀ Tag- / 🌙 Nacht-Modus
Desktop-Version anzeigen
Impressum
Datenschutz
Cookies
© 2024 WinFuture