Hoe incidentmanagement werkt in Jira Service Management
Overzicht
Incidentmanagement is het reageren op een ongeplande gebeurtenis of serviceonderbreking en het herstellen van de service naar de operationele status.
- Incident: een ongeplande onderbreking van een service of vermindering van de kwaliteit van de service.
- Belangrijk incident: een incident met aanzienlijke bedrijfsimpact, waarvoor een onmiddellijke gecoördineerde oplossing nodig is.
Een probleem is de nog niet bekende oorzaak achter een of meer incidenten.
Het platform voor incidentmanagement van Atlassian biedt alle context en gegevens die je nodig hebt om een incident snel en efficiënt op te oplossen.
- In Jira Service Management kunnen agents eenvoudig issues en door gebruikers gerapporteerde incidenten beheren.
- Agents kunnen grote incidenten snel escaleren als waarschuwing voor het team op afroep. Jira Service Management stelt IT- en DevOps-teams in staat om de controle te houden tijdens een incident door waarschuwingen te centraliseren, de juiste mensen op de hoogte te stellen en hen in staat te stellen samen te werken en snel actie te ondernemen.
- Jira Service Management's native asset- en configuratiebeheermogelijkheden (opgenomen in Premium- en Enterprise-abonnementen) helpen agents inzicht te krijgen in afhankelijkheden binnen hun IT-infrastructuur om mogelijke oorzaken van het incident te achterhalen.
- Ten slotte leggen de gedeelde workspaces incidentpraktijken, processen en procedures uit runbooks, kennisdatabases en PIR's op één plek vast.
Deze naadloze end-to-end-oplossing voor incidentmanagement helpt teams te escaleren, de juiste respondenten in te brengen, snel af te handelen en uiteindelijk downtime te minimaliseren.
Het proces voor incidentmanagement
Het belangrijkste van incidentmanagement is een goed proces hebben en daar aan vasthouden. Incidentrespons is een vrij brede term, dus laten we het een beetje verder opsplitsen in de meest waarschijnlijke stappen die je uitvoert zodra je een incident hebt geïdentificeerd, gecategoriseerd en geprioriteerd:
- Eerste diagnose: teams in DevOps-stijl zijn doorgaans eigenaar van een incident van diagnose tot oplossing, terwijl servicedesks met meerdere niveaus een frontlinieteam hebben dat hetzelfde probeert, maar indien nodig kunnen ze escaleren naar ondersteuningsteams op het 2e of 3e niveau.
- Escaleren: indien nodig neemt het volgende team de gelogde gegevens en gaat verder met het diagnoseproces, en als dit volgende team het incident niet kan diagnosticeren, escaleert het naar het volgende team.
- Communiceren: het team deelt regelmatig updates met betrokken interne en externe belanghebbenden.
- Onderzoek en diagnose: dit gaat door totdat de aard van het incident is vastgesteld. Soms halen teams externe middelen of andere leden van de afdeling binnen om de oplossing te raadplegen en te helpen.
- Oplossing en herstel: in deze stap komt het team tot een diagnose en voert het de nodige stappen uit om het incident op te lossen. Herstel houdt simpelweg in hoe lang het kan duren voordat een service volledig is hersteld, aangezien sommige fixes (zoals bugpatches, enz.) mogelijk moeten worden getest en geïmplementeerd, zelfs nadat de juiste oplossing is vastgesteld.
- Sluiting: als het incident is geëscaleerd, wordt het uiteindelijk teruggestuurd naar de frontoffice om te worden gesloten. Om de kwaliteit te waarborgen en een soepel proces te garanderen, mogen alleen medewerkers van de servicedesk incidenten sluiten en moet de eigenaar van het incident contact opnemen met de persoon die het incident heeft gemeld om te bevestigen dat de oplossing bevredigend is en dat het incident daadwerkelijk kan worden gesloten.
Kijk voor meer informatie op onze pagina Incidentmanagement.
Aan de slag met incidentmanagement in Jira Service Management
Aan de slag met incidentmanagement
Jira Service Management biedt een Information Technology Infrastructure Library (ITIL)-compatibele workflow voor incidentmanagement, genaamd: Incidentmanagement-workflow voor Jira Service Management. We raden je aan om met deze workflow te beginnen en deze in de loop van de tijd aan te passen aan je specifieke bedrijfsbehoeften. Meer informatie over workflows aanpassen.
Standaard bevat de incidentweergave van een agent de volgende velden. Als je extra velden nodig hebt, kun je ook aangepaste velden toevoegen.
Service level agreements (SLA's) aanmaken voor incidentrecords
Jira Service Management biedt krachtige ingebouwde SLA's, zodat teams kunnen bijhouden hoe goed ze voldoen aan het serviceniveau dat door hun klanten wordt verwacht. Projectbeheerders kunnen SLA-doelen maken die aangeven welke soorten verzoeken je wilt volgen en de tijd die nodig is om ze op te lossen. Van daaruit kun je de voorwaarden en kalenders definiëren die van invloed zijn wanneer SLA-metingen starten, pauzeren of stoppen.
Een nieuwe SLA maken:
- Selecteer in je serviceproject Projectinstellingen > SLA's. Alle bestaande SLA's worden hier getoond.
- Selecteer SLA toevoegen.
- Voer in het veld naast het klokpictogram een nieuwe naam in voor de SLA of kies een bestaande naam.
- (Je kunt de naam van je SLA niet wijzigen zodra deze is aangemaakt, dus kies er een die duidelijk uitlegt wat deze meet.)
- Stel doelen en voorwaarden vast voor de SLA. Meer informatie over het instellen van SLA-doelen en het opstellen van SLA-tijdstatistieken.
- Klik op Opslaan.
Incidenten markeren als belangrijke incidenten in Jira Service Management
Wanneer kritieke services uitval ondervinden, biedt Jira Service Management Cloud de nodige tools om agents te helpen incidenten snel op te lossen. Als je een incident markeert als belangrijk, zal dit beter zichtbaar zijn tussen alle andere incidenten. Ook worden deze incidenten gegroepeerd onder hun eigen door JQL aangedreven wachtrij met 'Belangrijke incidenten'.
Om een incident als een belangrijk incident te markeren:
- Navigeer naar het incident dat je als belangrijk incident wilt markeren.
- Schakel Belangrijk incident in in het detailgedeelte van de issue.
Opmerking: Als het veld Belangrijk incident niet verschijnt voor incidenten, moet je ervoor zorgen dat je het veld in je issueweergave hebt toegevoegd. Je moet een Jira-beheerder zijn om velden toe te kunnen voegen aan een issuetype.
Rechtstreeks vanuit een incident updates aanmaken en verzenden naar een Slack-kanaal
Met Jira Service Management kun je je workspace verbinden en voor elk incident een speciaal Slack-kanaal aanmaken. Door Slack-workspaces aan je serviceproject te koppelen, kun je Slack-kanalen aanmaken voor je incidenten, incidentrespondenten toevoegen aan je Slack-kanalen, incidentprioriteiten bijwerken, incidentacties ondernemen en je team helpen om sneller bij te springen tijdens incidenten.
Om een Slack-kanaal voor incidenten aan te maken:
- Navigeer naar het incident waarvoor je een Slack-kanaal wilt aanmaken.
- Selecteer Kanaal aanmaken in het detailgedeelte van de issue.
Updates voor incidenten verzenden naar interne belanghebbenden
Interne belanghebbenden zijn mensen die geen respondenten zijn, maar wel op de hoogte moeten worden gehouden van de voortgang van het incident om voorzorgsmaatregelen en acties te kunnen nemen. Jira Service Management biedt je de mogelijkheid om mensen als belanghebbenden toe te voegen en deze op de hoogte te houden door e-mailberichten te verzenden.
Interne belanghebbenden toevoegen/verwijderen:
- Navigeer naar het incident waar je interne belanghebbenden wilt toevoegen.
- Selecteer Beheren naast het veld van de belanghebbende onder details.
- Zoek naar mensen die je als belanghebbenden wilt toevoegen.
Om een update te sturen naar interne belanghebbenden:
- Selecteer Update sturen naar belanghebbenden in het gedeelte Activiteit van de issueweergave.
- Voer een samenvatting en een bericht in.
- Selecteer Verzenden.
Incidenten snel afhandelen met je team via conference calls
Jira Service Management biedt meetingrooms met video/spraak om incidenten vanaf een centrale plaats te coördineren en te beheren.
Om een conference call te starten:
- Navigeer naar het incident waarvoor je een conference call wilt starten.
- Selecteer Gesprek starten (of Deelnemen aan gesprek voor een bestaand gesprek) naast het veld Conference call onder details.
Meer informatie over het openen en aanmaken van beoordelingen na incidenten (PIR's)
Beoordelingen na incidenten stellen je in staat om kwetsbaarheden in je systeem aan het licht te brengen, herhaalde incidenten te stoppen en de tijd voor het oplossen van incidenten in de toekomst te verkorten. Het is een belangrijke stap in de levenscyclus van een 'always-on'-service. De bevindingen uit je beoordeling moeten worden meegenomen in je planningsproces om ervoor te zorgen dat kritieke oplossingen worden gebruikt in aankomende werkzaamheden. Het documenteren van het incident en de manier waarop het team het heeft opgelost, kan nuttig zijn bij het afhandelen van toekomstige incidenten. Teams kunnen langetermijnoplossingen creëren voor problemen die tot een incident leiden en de beoordeling na het incident koppelen aan het incident in Jira Service Management.
Om de functie voor beoordeling na incident in te schakelen:
- Navigeer naar Projectinstellingen > Functies.
- Schakel Beoordelingen na incidenten in onder ITSM-categorieën.
Als je deze categorie inschakelt, krijg je toegang tot nieuwe functies voor je aanvragen. Je moet nieuwe aanvraagtypen aanmaken of je bestaande aanvraagtypen toewijzen aan de categorie beoordelingen na incidenten om aan de slag te gaan.
Om toegang te krijgen tot je beoordelingen na incidenten:
- Selecteer Beoordeling na incident in het zijbalkmenu van je project.
- Selecteer de juiste wachtrij voor beoordelingen na incidenten.
Om een nieuwe beoordeling na een incident aan te maken:
- Selecteer Aanmaken in de bovenste menubalk.
- Selecteer het aanvraagtype voor de beoordeling na incident dat je hebt ingesteld in de vervolgkeuzelijst.
- Vul de vereiste informatie in en koppel het juiste incident aan de PIR in het veld gekoppelde issues.
- Selecteer Aanmaken als je klaar bent.
Pro-tip: Beoordelingen na incidenten kunnen ook worden aangemaakt met behulp van de eigen automatiseringsengine van Jira Service Management. Je kunt bijvoorbeeld een automatiseringsregel instellen om een beoordeling na het incident aan te maken telkens wanneer er een belangrijk of kritisch incident met prioriteit door je team wordt afgesloten.
Meerdere incidenten koppelen aan een probleemrapport
Met Jira Service Management kun je meerdere issues aan elkaar koppelen. Je kunt bijvoorbeeld meerdere incidentrecords koppelen aan een groter probleemrapport.
Om meerdere incidenten aan een probleemrapport te koppelen:
- Bekijk het incidentrecord.
- Selecteer Issue koppelen.
- Selecteer in het veld gekoppelde issues wordt veroorzaakt door.
- Voer het issue in (of selecteer in het vervolgkeuzemenu) voor het issue dat je wilt koppelen in het veld Issue.
- Selecteer Koppelen.
Best practices en tips voor incidentmanagement
Maak het eenvoudig om door gebruikers en systemen gerapporteerde incidenten vast te leggen
Jira Service Management is de bron van waarheid voor zowel kleine als grote incidenten. De klantenportal legt door gebruikers gerapporteerde incidenten op een complete en consistente manier vast, met alle nodige informatie die het ondersteuningsteam nodig heeft om het incident te evalueren. Wanneer werknemers of klanten een incident zien, kunnen ze dit melden in Jira Service Management. Van daaruit worden incidenten naar de juiste wachtrijen voor agents geleid.
Als het gaat om het vroegtijdig opsporen van incidenten en uitval, zijn effectieve monitoring de ogen en oren voor IT-operaties. Voor door het systeem gedetecteerde incidenten integreert Jira Service Management eenvoudig met meer dan 200 app- en webservices, zoals Slack, Datadog, Sumo Logic en Nagios, om waarschuwingsgegevens te synchroniseren en je incidentenworkflow te stroomlijnen.
Verminder waarschuwingsmoeheid met een slim op afroep-rooster
Wanneer medewerkers op afroep worden overspoeld met irrelevante waarschuwingen, worden ze waarschuwingsmoe en missen ze belangrijke meldingen. De ingebouwde mogelijkheden voor incidentmanagement van Jira Service Management zorgen ervoor dat je team nooit een kritieke waarschuwing mist.
Door schema's op te stellen en escalatieregels in één interface te definiëren, weet je team altijd wie aanwezig en verantwoordelijk is tijdens incidenten. De oplossing groepeert waarschuwingen, filtert de ruis weg en waarschuwt teamleden via meerdere kanalen, zoals tekst, telefoongesprek, mobiel push of e-mail, samen met de relevante context die nodig is om onmiddellijk met de oplossing te beginnen.
Gebruik ChatOps en runbooks om de teamcoördinatie te verbeteren
Met Jira Service Management hebben teams een centrale plek om samen te werken, realtime informatie te delen en snelle oplossing te vinden met het commandocentrum voor incidenten. In plaats van door gefragmenteerde één-op-één chatupdates te navigeren of door lange gespreksgeschiedenissen te bladeren, definieer je vooraf een videoconferentieruimte voor teams om dynamisch te chatten, rollen toe te wijzen en zelfs beslissende acties te ondernemen in de interface. Door runbooks aan waarschuwingen toe te voegen, kunnen teams snel standaardhersteltaken starten, zowel automatisch als op aanvraag.
Runbooks zijn ook geweldig voor het documenteren van veelgebruikte troubleshootingmethoden om waarschuwingen aan te pakken en uitval op te lossen. Met runbooks hebben je medewerkers alle informatie die ze nodig hebben om snel een incident te prioriteren binnen handbereik. In veel gevallen kunnen teams de tijden voor het oplossen van incident met 40% verkorten.
Maak een proactief draaiboek voor incidentmanagement
Plan van tevoren je reactiestrategie voor incidenten. Zo verlicht je stress, houd je je team gefocust tijdens het incident en verkort je de oplostijd. Zorg ervoor dat je zowel operationele als teamgebaseerde samenwerkingsmethoden opneemt:
- Identificeer wat je team het belangrijkst vindt tijdens de incidentrespons en maak een plan om deze waarden consistent na te leven. Waarden kunnen bijvoorbeeld samenwerking, communicatie en 'verwijtloze' beoordelingen na incidenten zijn.
- Definieer duidelijk wat er wordt verstaan onder een groot incident.
- Documenteer je werkwijze bij grote incidenten.
- Stel je incidentresponscommunicatie, bijvoorbeeld met responssjablonen en de communicatie voor belanghebbenden (zowel extern als intern) vast.
- Bepaal wie de kernleden van je beste team voor incidentrespons zijn.
- Stel je PIR-werkwijzen vast.
- Voer schuldloze PIR's uit voor alle grote incidenten.
- Publiceer en deel PIR-inzichten.
- Oefen met simulaties van grote incidenten.
Focus op het verbeteren van de gemiddelde tijd tot herstel (MTTR)
Het opzetten van een sterk incidentmanagementproces is cruciaal om de impact van het incident te verminderen en diensten snel te herstellen. Het verlagen van de gemiddelde tijd tot herstel (MTTR) en het stroomlijnen van de analyse van de oorzaak om toekomstige uitval te voorkomen is essentieel om de respons te verbeteren. Forrester heeft zelfs ontdekt dat 70% van de reactietijd voor incidenten wordt besteed in de fase van onderzoek en diagnose.
Bouw vertrouwen op met gecentraliseerde externe communicatie
Veel teams gebruiken een gecentraliseerd dashboard, zoals Statuspage, om te rapporteren over de status van kritieke services. Statuspage werkt als één kanaal voor duidelijke en proactieve massacommunicatie met zowel interne als externe gebruikers, samen met geautomatiseerde meldingen en updates.
Statuspage houdt interne teams ook op de hoogte van zowel geplande als ongeplande downtime. Klanten en werknemers kunnen zich abonneren op updates, wat consistente communicatie bevordert en handmatige updates vermindert.
Bekijk voor meer informatie onze pagina met best practices voor incidentmanagement
Aan de slag
Beheer van serviceaanvragen
Aan de slag
Probleembeheer