Incidentmanagement voor razendsnelle teams
Postmortems voor openbare vs. particuliere incidenten
Weten wat het juiste moment is om een openbare uitleg na het incident te delen
Er was een tijd dat bijna elk IT-incident beperkt bleef tot de vier muren van de organisatie waarin het plaatsvond. Maar vandaag de dag is dat, met webservices en cloudinfrastructuur, zelden het geval. Technologische incidenten zijn een echt 'één-op-veel'-probleem. Dat heeft geleid tot een grote verschuiving in de manier waarop teams reageren, leren en communiceren over incidenten.
Overweeg het incidentpostmortem (ook vaak de 'post-incident review' of 'PIR' genoemd).
Een post-mortem van een incident brengt mensen samen om de details van het incident te bespreken: waarom het is gebeurd, de impact, welke acties er zijn ondernomen om het op te lossen en wat er gedaan kan worden om te voorkomen dat het opnieuw gebeurt.
Een incidentpostmortem van een incident kan worden onderverdeeld in twee verschillende artefacten: de vergadering waarin het incident wordt besproken, en het bijbehorende postmortemrapport dat op basis van die vergadering is opgesteld.
Beide worden vaak door elkaar gebruikt wanneer mensen het over een 'postmortem' hebben. Mensen hebben het misschien over een van beide, of beide, wanneer ze de term gebruiken.
Partners, klanten en eindgebruikers willen misschien ook weten wat er is gebeurd en welke stappen je hebt genomen om hun ervaring te verbeteren. Het is misschien niet in alle gevallen gepast om je incidentpostmortem beschikbaar te maken op je openbare website, maar je marketing- of pr-team kan helpen bij het communiceren, zodat mensen de informatie ontvangen op een manier die informatief is en vertrouwen in je diensten oplevert.
Wanneer moet je een incidentpostmortem uitvoeren?
Bij Atlassian voeren we altijd interne postmortems uit voor incidenten met ernstgraad 1 en 2 ('grote' incidenten dus). Voor kleine incidenten zijn ze optioneel. We moedigen medewerkers aan om het postmortemproces te gebruiken voor elke situatie waarin dat nuttig kan zijn.
Wie voltooit de postmortem?
Meestal is het team dat de service levert die het incident heeft veroorzaakt, verantwoordelijk voor de bijbehorende postmortem. Ze wijzen één persoon aan die verantwoordelijk is voor het uitvoeren van de postmortem. De issue wordt aan hem of haar toegewezen. De verantwoordelijke persoon voor de postmortem verwerkt de postmortem via concepten en goedkeuring, tot het moment van publicatie. Incidenten op infrastructuur- en platformniveau hebben vaak gevolgen voor bijna het hele bedrijf. Dat maakt deze postmortems ingewikkelder en inspannender. Daarom wijzen we soms een toegewijde programmamanager toe aan postmortems op infrastructuur- of platformniveau. Zij kunnen beter tussen groepen werken en zijn in staat om het vereiste inspanningsniveau te leveren.
Een intern postmortemrapport delen
We hebben ervaren dat we de waarde van een postmortem kunnen vermenigvuldigen door alles wat we hebben geleerd met het hele bedrijf te delen zodra de postmortem is goedgekeurd. Om dit te bereiken, hebben we bij Atlassian een automatiseringsactie die een conceptblogpost in Confluence maakt wanneer het postmortemticket is goedgekeurd.
Een postmortemrapport van een openbaar incident maken
Hoewel dat minder gebruikelijk is, is het vaak een goed idee om na een incident een openbare versie van een postmortem te publiceren.
Dit komt vooral veel voor bij grootschalige consumentendiensten met uitval die veel gebruikers treft. Vaker wel dan niet publiceren deze teams een verkorte versie van het interne rapport, en dus niet het volledige interne rapport. Het is belangrijk om alle privégegevens of gevoelige informatie eruit te halen.
Een postmortemrapport van een openbaar incident delen
Het kan lastig zijn om het juiste kanaal te achterhalen voor publicatie van een openbare postmortem. Bij sommige teams kan het rechtstreeks op je bedrijfsblog of website worden gezet. Andere teams hebben een aparte technische blog waar een postmortem zou passen.
In ons product Statuspage kunnen gebruikers een openbare postmortem direct op hun statuspagina publiceren nadat een incident is afgesloten.
Ontdek incidentcommunicatie met Statuspage
In deze tutorial laten we je zien hoe je incidentsjablonen kunt gebruiken om effectief te communiceren tijdens storingen. Aanpasbaar voor de vele soorten serviceonderbrekingen.
Lees deze tutorialHet belang van een postmortemproces bij incidenten
Een postmortemincident, ook wel bekend als een beoordeling na een incident, is de beste manier om door te werken wat er tijdens een incident is gebeurd en geleerde lessen vast te leggen.
Lees dit artikel