Vorfallmanagement für High-Velocity-Teams
Atlassian-Handbuch für Vorfälle
Von den für technische Services zuständigen Teams wird heute erwartet, dass sie Verfügbarkeit rund um die Uhr gewährleisten.
Wenn ein Problem auftritt, sei es ein Ausfall oder ein Funktionsfehler, müssen die Teammitglieder sofort reagieren und den Service wiederherstellen. Dieser als Vorfallsmanagement bezeichnete Prozess ist für Unternehmen aller Größen eine kontinuierliche, komplexe Herausforderung.
Wir möchten Teams aus den verschiedensten Unternehmen helfen, ihr Vorfallmanagement zu verbessern. Nach dem Vorbild von Teams wie denen bei Google haben wir das vorliegende Handbuch als Zusammenfassung des Atlassian-Prozesses für das Vorfallmanagement zusammengestellt. Wir zeigen dabei, welche Erkenntnisse wir im Laufe von zehn Jahren der Vorfallbehebung gewonnen haben. Das Handbuch basiert auf unseren Erfahrungen, aber du kannst die Erkenntnisse individuell an die Anforderungen deines eigenen Teams anpassen.
Das Handbuch in gedruckter Form oder als PDF
Wir haben eine begrenzte Auflage des Handbuchs zum Vorfallmanagement drucken lassen und versenden diese Handbücher kostenlos. Alternativ kannst du die PDF-Version herunterladen.
Wir möchten Teams aus den verschiedensten Unternehmen helfen, ihr Vorfallmanagement zu verbessern. Nach dem Vorbild von Teams wie denen bei Google haben wir das vorliegende Handbuch als Zusammenfassung des Atlassian-Prozesses für das Vorfallmanagement zusammengestellt. Wir zeigen dabei, welche Erkenntnisse wir im Laufe von zehn Jahren der Vorfallbehebung gewonnen haben. Das Handbuch basiert auf unseren Erfahrungen, aber du kannst die Erkenntnisse individuell an die Anforderungen deines eigenen Teams anpassen.
Phase | Wert für Vorfälle | Verwandter Unternehmenswert von Atlassian | Begründung |
1. Erkennung | Atlassian weiß Bescheid, bevor Kunden den Vorfall bemerken. | Mit Herz und Ausgewogenheit bauen | Bei einem ausgewogenen Service sind ausreichend Überwachungs- und Benachrichtigungsfunktionen implementiert, um Vorfälle zu erkennen, bevor unsere Kunden sie bemerken. Im Optimalfall werden wir im Rahmen der Überwachung schon benachrichtigt, bevor ein Problem zu einem Vorfall führt. |
2. Reaktion | Eskalation ist alles. | Teamgeist ist Trumpf | Niemand wird gerne aus dem Schlaf gerissen und wir nehmen diese Verantwortung nicht auf die leichte Schulter. Mitarbeiter verstehen aber, dass sie hin und wieder für einen Vorfall geweckt werden, bei dem es sich im Nachhinein als unnötig herausstellt. Schwieriger ist es in der Regel, bei einem größeren Vorfall zu spät benachrichtigt zu werden und eine Art Aufholjagd beginnen zu müssen. Niemand kann alles wissen – zögere daher nicht, einen Vorfall zu eskalieren. |
3. Wiederherstellung | Probleme passieren nun mal, bringe sie schnell in Ordnung. | Versuche nicht, den Kunden hinters Licht zu führen. | Unseren Kunden ist es egal, weshalb ein Service ausgefallen ist. Sie erwarten nur, dass wir ihn so schnell wie möglich wiederherstellen. Bemühe dich daher immer, einen Vorfall schnell zu erledigen, um die Beeinträchtigung für unsere Kunden zu minimieren. |
4. Erkenntnisgewinn | Keine Schuldzuweisungen! | Open Company, No Bullshit | Vorfälle sind beim Betreiben von Services nicht zu vermeiden. Wir verbessern unsere Services, indem wir unsere Teams zur Verantwortung ziehen, dabei aber niemandem die Schuld geben. |
5. Optimierung | Lasse nicht zu, dass derselbe Vorfall zweimal passiert. | Sei du selbst die Veränderung, die du dir wünschst | Ermittle die grundlegende Ursache des Vorfalls und kläre, welche Änderungen nötig sind, um Vorfälle dieser Art künftig zu verhindern. Verpflichte dich auf Fristen zur Umsetzung bestimmter Änderungen. |
Einrichten eines Bereitschaftsplans mit Opsgenie
In diesem Tutorial erfährst du, wie du einen Bereitschaftsplan einrichtest, Regeln für Außerkraftsetzungen anwendest, Bereitschaftsbenachrichtigungen konfigurierst und vieles mehr – und das alles in Opsgenie.
Dieses Tutorial ansehenSo reagieren wir auf einen Vorfall
Hier erläutern wir den in unserem Handbuch dargelegten Atlassian-Prozess zur Reaktion auf Vorfälle. Erfahre, welche Schritte ein Vorfallmanager von der Erkennung bis zur Lösung eines Vorfalls durchführt.
Diesen Artikel lesen