Gestion des incidents pour les équipes haute vélocité
Répondre à un incident
Les sections suivantes décrivent le processus de réponse aux incidents d'Atlassian. Le responsable de l'incident suit l'incident dans une série d'étapes allant de la détection à la résolution.
Champ Jira | Type | Texte d'aide |
Résumé | Texte | Quelle est l'urgence ? |
Description | Texte | Quel est l'impact sur les clients ? Incluez vos coordonnées pour que les intervenants puissent vous contacter. |
Gravité | Sélection unique | (Lien hypertexte vers une page Confluence avec notre échelle de gravité) Sélectionner une gravité de 2 ou 1 signifie que vous croyez que le problème doit être résolu immédiatement (les personnes adéquates seront contactées). |
Service défectueux | Sélection unique | Le service dont la panne provoque l'incident. En cas de doute, indiquez le service que vous soupçonnez. Sélectionnez « Inconnu » si vous n'en avez aucune idée. |
Produits concernés | Cases à cocher | Quels produits sont concernés par l'incident ? Sélectionnez toutes les réponses qui s'appliquent. |
Lorsque l'incident est créé, l'identifiant de son ticket est utilisé dans toutes les communications internes relatives à l'incident.
Les clients ouvriront souvent des cas de support au sujet d'un incident qui les affecte. Lorsque nos équipes de support client déterminent que ces cas sont tous liés à un incident, ils étiquettent ces cas avec l'identifiant du ticket de l'incident pour suivre l'impact sur le client et simplifier le suivi des clients affectés lors de la résolution de l'incident.
Gravité | Description | Exemples |
1 | Un incident critique à grand impact |
|
2 | Un incident majeur sans impact significatif |
|
3 | Un incident mineur avec un faible impact |
|
Une fois que vous avez déterminé l'impact de l'incident, ajustez ou confirmez la gravité du ticket d'incident et communiquez-le à l'équipe. Nous avons constaté que numéroter le niveau était très utile pour communiquer clairement la gravité.
Chez Atlassian, les incidents de gravité 3 sont transmis aux équipes de livraison pour résolution pendant les heures de bureau, tandis que les incidents de gravité 1 et 2 nécessitent l'appel de membres de l'équipe pour une correction immédiate. La différence de réponse entre la gravité 1 et 2 est plus nuancée et dépend du service concerné.
Votre matrice de gravité doit être documentée et convenue entre toutes vos équipes de sorte à fournir une réponse cohérente aux incidents en fonction de l'impact sur le client.
Statuspage interne | Statuspage externe | |
Nom de l'incident | | Étude des tickets avec |
Message | Nous étudions un incident affectant | Nous étudions les tickets liés à |
En plus de créer un incident Statuspage, nous envoyons un e-mail à une liste de diffusion des incidents, qui inclut notre direction technique, les principaux responsables de la gestion des incidents majeurs (MIM) et d'autres personnes intéressées. Le contenu de cet e-mail est identique à celui de la Statuspage interne de l'incident. L'e-mail permet au personnel de répondre et de poser des questions, tandis que la Statuspage est davantage une communication à sens unique.
Notez que nous incluons toujours l'identifiant du ticket Jira de l'incident dans toutes les communications internes relatives à l'incident, afin que le personnel sache quel groupe de discussion rejoindre pour toute question supplémentaire.
Configuration d'un planning d'astreinte grâce à Opsgenie
Ce tutoriel vous apprendra à configurer un planning d'astreinte, à appliquer des règles de remplacement, à configurer les notifications d'astreinte, etc. Et tout cela, sans quitter Opsgenie.
Lire ce tutorielPost-mortems : améliorer les processus de gestion des incidents
Apprenez à mener des post-mortems efficaces afin d'améliorer vos processus de gestion des incidents et d'éviter de futurs tickets.
Lire cet article