Incidentmanagement voor razendsnelle teams
Atlassian incidenthandboek
Teams die in deze tijd technische services verlenen, worden geacht 24/7 beschikbaar te zijn.
Als er iets misgaat, of dit nu een stroomstoring of een kapotte functie is, moeten teamleden onmiddellijk reageren en de service herstellen. Dit proces noemen we incidentmanagement, en het is een voortdurende, complexe uitdaging voor grote en kleine bedrijven.
We willen teams overal ter wereld helpen hun incidentmanagement te verbeteren. We zijn geïnspireerd door Google, en hebben dit handboek samengesteld als samenvatting van het incidentmanagementproces van Atlassian. Dit zijn de lessen die we hebben geleerd in de ruim tien jaar dat we op incidenten reageren. Het is gebaseerd op onze unieke ervaringen en we hopen dat je ze aan kunt passen om toe te spitsen op de behoeften van je eigen team.
Krijg ons handboek fysiek of in pdf
We hebben een beperkt aanbod van gedrukte versies van het Handboek incidentmanagement die we gratis verzenden. Of download een pdf-versie.
We willen teams overal ter wereld helpen hun incidentmanagement te verbeteren. We zijn geïnspireerd door Google, en hebben dit handboek samengesteld als samenvatting van het incidentmanagementproces van Atlassian. Dit zijn de lessen die we hebben geleerd in de ruim tien jaar dat we op incidenten reageren. Het is gebaseerd op onze unieke ervaringen en we hopen dat je ze aan kunt passen om toe te spitsen op de behoeften van je eigen team.
Fase | Incidentwaarde | Gerelateerde Atlassian-waarde | Onderbouwing |
1. Detecteer | Atlassian is eerder op de hoogte dan klanten | Bouw met je hart en in balans | Een uitgebalanceerde service bevat voldoende monitoring en waarschuwingen om incidenten te detecteren voordat onze klanten dit doen. De beste monitoring waarschuwt ons voor problemen voordat dit incidenten worden. |
2. Reageer | Escaleren, escaleren, escaleren | Werk samen als een team | Niemand vindt het leuk om wakker te worden en wij nemen die verantwoordelijkheid zeer serieus. Maar medewerkers begrijpen ook dat ze af en toe wakker worden gemaakt voor een incident waarbij blijkt dat ze niet nodig zijn. Wat meestal moeilijker is, is wakker worden na een ernstig incident en ontzettend achterlopen, terwijl je eerder had moeten worden gewaarschuwd. We hebben niet altijd overal antwoord op, dus 'escaleren kun je leren'. |
3. Herstel | Er worden fouten gemaakt, maar herstel ze tijdig | Houd de klant niet voor de gek | Het maakt onze klanten niet uit waarom de service niet kan worden geleverd, ze willen gewoon dat we de service zo snel mogelijk herstellen. Twijfel nooit om een incident snel te herstellen, zodat we de impact voor onze klanten zo goed mogelijk kunnen beperken. |
4. Leer | Altijd zonder een schuldige | Open bedrijf, geen flauwekul | Incidenten zijn onderdeel van lopende services. We verbeteren services door teams ter verantwoording te roepen, niet door schuldigen aan te wijzen. |
5. Verbeter | Een incident mag nooit nog een keer voorkomen | Wees de verandering die je wenst | Achterhaal de belangrijkste reden en voer de wijzigingen door die voorkomen dat dit specifieke incident nog een keer plaatsvindt. Zet je in voor het leveren van specifieke wijzigingen op specifieke datums. |
Een op afroep-rooster opstellen met Opsgenie
In deze tutorial leer je hoe je een op afroep-rooster instelt, overschrijfregels toepast, op afroep-meldingen configureert en meer, allemaal binnen Opsgenie.
Lees deze tutorialHoe we op een incident reageren
Hier volgt het proces van Atlassian voor het reageren op incidenten, uit ons handboek. Bekijk de stappen die een incidentmanager neemt van detectie tot oplossing.
Lees dit artikel