Gerenciamento de incidentes para equipes de alta velocidade
Criação de relatórios de análise retrospectiva
Por que coletar e documentar os dados é fundamental para o processo de análise retrospectiva de incidentes
Uma análise retrospectiva de incidente pode ser dividida em dois artefatos distintos: a reunião onde o incidente é discutido e o relatório de análise retrospectiva correspondente criado como um resultado dessa reunião.
Essas duas atividades, a reunião e o relatório, são usadas como intercambiáveis com frequência quando as pessoas se referem a uma “análise retrospectiva”. As pessoas podem estar falando sobre um ou ambos quando usam o termo.
Quer começar a usar um template de análise retrospectiva? Confira os templates de análises retrospectivas.
Contudo, há uma diferença entre a reunião de análise retrospectiva e o relatório escrito de análise retrospectiva.
Na Atlassian, normalmente usamos análise retrospectiva, ou análise retrospectiva de incidente, para descrever todo o processo de análise de um incidente, incluindo:
- Realizar uma reunião de análise retrospectiva de incidente
- Capturar ações e informações durante a reunião
- Obter aprovação sobre ações de acompanhamento e comunicar o resultado da reunião
Leia mais sobre como a Atlassian gerencia análises retrospectivas no manual de gerenciamento de incidentes.
Quais as características de um bom relatório de análise retrospectiva de incidente?
Tópicos claros e consistentes
Um bom relatório deve ser baseado em uma estrutura clara e consistente. Equipes eficazes configuram cada análise retrospectiva em um template, no qual os participantes respondem a um conjunto de perguntas ou solicitações.
Assim, você garante que as principais informações não sejam esquecidas. Também cria consistência entre os incidentes e ajuda a equipe a identificar padrões, tendências e oportunidades de melhoria. A estrutura pode ser iterada e melhorada ao longo do tempo, mas todas as mudanças devem ser intencionais.
Riqueza de informações e dados
Os campos da análise retrospectiva não são lugares para economizar informações e minimizar eventos. É aqui que você quer ser mais específico. Não diga que você viu um pico de tráfego, diga com precisão quanto e qual métrica mudou. Não diga que a equipe estava confusa, mostre uma citação exata do histórico de bate-papo em que alguém expressou confusão.
Linguagem inclusiva, sem apontar dedos
Como muitas equipes, praticamos análises retrospectivas sem apontar culpados aqui na Atlassian. Durante a reunião e na análise do incidente, é importante não apontar o dedo para ninguém. Tome o mesmo cuidado com as palavras escritas no relatório. Evite linguagem que culpe ou destaque as pessoas.
Perguntas importantes a serem feitas durante um relatório de análise retrospectiva
Estes são os prompts incluídos no recurso de análise retrospectiva do Opsgenie:
- Precedentes
Descrever as circunstâncias que levaram a este incidente
- Falha
Descrever o que falhou em funcionar conforme esperado
- Detecção
Descrever como o incidente foi detectado
- Causas raiz
Faça uma análise dos 5 porquês para entender as verdadeiras causas do incidente
- Mitigação e resolução
Que medidas você tomou para resolver este incidente?
- Lições aprendidas
O que correu bem? O que a gente poderia ter feito melhor? O que mais você aprendeu?
Confira o artigo sobre templates de análise retrospectiva para mais exemplos de perguntas a serem incluídas em um relatório de análise retrospectiva.
O que mais incluir em um relatório de análise retrospectiva
- Capturas de tela
Anexe capturas de tela relevantes, em especial as que a equipe de resposta fez durante a interrupção. Quais mudanças você viu no produto? Qual comportamento do produto não aconteceu como esperado?
- Bilhetes
Link para quaisquer bilhetes relevantes relacionados ao incidente.
- Feedback dos clientes
Os clientes enviaram comentários sobre o incidente? Eles podem ser relatados a um help desk, por e-mail ou nas redes sociais. Não se preocupe em incluir tudo.
- Tabelas e gráficos
Quais visualizações de dados ajudam a mostrar o impacto do incidente?
- Dados
Há algum outro ponto de dados importante sobre o incidente ou seu impacto?
- Trocas de bate-papo
Se a equipe usar uma ferramenta de bate-papo como o Slack durante o esforço de resposta, considere incluir mensagens ou trocas importantes do histórico de bate-papo.
- Linhas do tempo
Uma linha do tempo clara do incidente é uma excelente ajuda para a análise de incidentes. Quais foram os principais eventos e os carimbos de data/hora durante o incidente.
Relatórios de análise retrospectiva internos vs. externos
Embora seja menos comum, algumas empresas escolhem publicar uma versão pública de uma análise retrospectiva após um incidente. Essa decisão é bem comum para serviços ao consumidor em grande escala que apresentam interrupções que afetam muitos usuários. Eles podem publicar o relatório completo da análise retrospectiva ou (o que é mais provável) uma versão reduzida do relatório interno. Pode ser necessário remover algumas informações confidenciais ou privadas.
Como os profissionais respondem a incidentes graves
Obtenha o manual gratuito de gerenciamento de incidentes. Aprenda todas as ferramentas e técnicas que a Atlassian usa para gerenciar incidentes graves.
Aprenda a comunicação de incidentes com o Statuspage
Neste tutorial, você vai ver como usar templates de incidentes para se comunicar com eficácia durante interrupções. Adaptável a muitos tipos de interrupção de serviço.
Leia este tutorialA importância de um processo de análise retrospectiva de incidentes
Uma análise retrospectiva de incidente, também conhecida como revisão pós-incidente, é a melhor maneira de trabalhar o que aconteceu durante um incidente e capturar as lições aprendidas.
Leia este artigo