Zarządzanie incydentami dla dynamicznych zespołów
Tworzenie raportów z analiz post-mortem
Dlaczego gromadzenie i dokumentowanie danych jest kluczem do procesu analizy post-mortem incydentu?
Analizę post-mortem można podzielić na dwa odrębne artefakty: spotkanie, na którym omawiany jest incydent, oraz raport z analizy post-mortem powstały jako wynik tego spotkania.
Te dwa rodzaje aktywności, czyli spotkanie oraz raport, często są zamiennie określane mianem „analizy post-mortem”. Posługując się tym pojęciem, ludzie mogą mieć na myśli jeden z tych elementów lub obydwa.
Chcesz zacząć od szablonu analizy post-mortem? Zapoznaj się z naszymi szablonami analizy post-mortem.
Jest jednak różnica między spotkaniem post-mortem a pisemnym raportem z analizy post-mortem.
W Atlassian pod pojęciem analizy post-mortem lub analizy post-mortem incydentu rozumiemy zasadniczo cały proces analizowania incydentu, obejmujący:
- Prowadzenie spotkania post-mortem dotyczącego incydentu.
- Zarejestrowanie zgromadzonych informacji oraz działań podjętych w trakcie spotkania.
- Uzyskanie zgody na podjęcie kolejnych kroków i poinformowanie o wynikach spotkania.
Więcej informacji na temat sposobów zarządzania analizami post-mortem w Atlassian znajdziesz w naszym Podręczniku zarządzania incydentami.
Składniki dobrego raportu z analizy post-mortem incydentu
Precyzyjne i spójne polecenia
Dobry raport powinien opierać się na czytelnej i spójnej strukturze ramowej. Skuteczne zespoły przeprowadzają każdą analizę post-mortem w oparciu o szablon, w którym uczestnicy odpowiadają na zbiór pytań lub poleceń.
Dzięki temu nie zapomina się o najważniejszych szczegółach. Pozwala to również uspójnić incydenty i pomaga zespołowi w identyfikowaniu wzorców, trendów oraz możliwości poprawy. Taka struktura ramowa może podlegać iteracjom i można ją z czasem ulepszać, jednak wszelkie wprowadzane zmiany powinny być celowe.
Bogactwo szczegółów i danych
Pola w dokumentacji analizy post-mortem nie są miejscami, w których można pomijać szczegóły lub pobieżnie opisywać zdarzenia. W tych miejscach należy podać bardzo szczegółowe i konkretne informacje. Nie pisz, że wystąpił skok w natężeniu ruchu, tylko podaj wskaźnik, który się zmienił oraz wartość jego zmiany. Nie pisz, że zespół był zdezorientowany, tylko zamieść konkretny cytat z historii czasu, w którym ktoś wyraził konsternację.
Inkluzywny i wolny od wskazywania winnych język
Podobnie jak wiele zespołów, w Atlassian praktykujemy analizy post-mortem bez wskazywania winnych. Ważne, aby spotkaniu i analizie incydentu nie towarzyszyło szukanie winnych. To samo dotyczy również treści raportu. Należy unikać sformułowań wskazujących konkretne osoby lub obarczających je winą.
Ważne pytania, które należy zadać w raporcie z analizy post-mortem
Poniżej przedstawiamy elementy zawarte w funkcji analizy post-mortem rozwiązania Opsgenie:
- Okres poprzedzający
Opisz okoliczności, które doprowadziły do tego incydentu.
- Usterka
Opisz, co nie działało zgodnie z oczekiwaniami.
- Wykrycie
Opisz, jak wykryto incydent.
- Główne przyczyny
Przeprowadź analizę „5 × dlaczego”, aby poznać rzeczywiste przyczyny incydentu.
- Ograniczenie skutków i rozwiązanie
Jakie kroki podjęto w celu rozwiązania tego incydentu?
- Wyciągnięte wnioski
Co poszło dobrze? Co można było zrobić lepiej? Jakie inne wnioski udało się wyciągnąć?
Więcej przykładowych pytań do uwzględnienia w raporcie post-mortem znajdziesz w naszym artykule na temat szablonów analizy post-mortem.
Inne elementy do uwzględnienia w raporcie z analizy post-mortem
- Zrzuty ekranu
Dołącz odpowiednie zrzuty ekranu, zwłaszcza te, które zostały wykonane przez zespół reagujący w trakcie awarii. Jakie zmiany zaobserwowano w produkcie? Jakie funkcje produktu nie działały w oczekiwany sposób?
- Zgłoszenia
Łącza do istotnych zgłoszeń powiązanych z incydentem.
- Opinie klientów
Czy pojawiły się jakieś opinie klientów na temat incydentu? Zazwyczaj zgłaszane są za pośrednictwem pomocy technicznej, mediów społecznościowych lub poczty e-mail. Nie musisz uwzględniać ich wszystkich.
- Wykresy i grafy
Jakie wizualizacje danych pomagają pokazać wpływ incydentu?
- Dane
Czy istnieją inne kluczowe dane dotyczące incydentu lub jego wpływu?
- Rozmowy na czacie
Jeśli zespół podczas reagowania korzysta z narzędzia czatu, takiego jak Slack, rozważ dołączenie wszelkich kluczowych komunikatów lub konwersacji z historii czatu.
- Osie czasu
Precyzyjna oś czasu stanowi doskonałą pomoc przy analizowaniu incydentu. Uwzględnij kluczowe zdarzenia, które miały miejsce w trakcie incydentu, wraz z ich znacznikami czasu.
Wewnętrzne i zewnętrzne raporty z analiz post-mortem
Niektóre organizacje decydują się na publikowanie powszechnie dostępnych wersji analiz post-mortem po incydentach, choć nie jest to częstą praktyką. Zwykle ma to miejsce w przypadku usług udostępnianych klientom na dużą skalę, których awaria dotyka wielu użytkowników. Czasami publikuje się pełny raport z analizy post-mortem jednak (co bardziej prawdopodobne) częściej jest to okrojona wersja raportu wewnętrznego. Zapewne konieczne jest usunięcie danych wrażliwych lub osobowych.
![Podręcznik zarządzania incydentami](https://wac-cdn.atlassian.com/dam/jcr:8b30a82b-4ede-499d-9927-34fdf9436dc9/im-handbook.png?cdnVersion=2022)
Jak profesjonaliści reagują na poważne incydenty?
Pobierz nasz bezpłatny podręcznik zarządzania incydentami. Poznaj wszystkie narzędzia i techniki używane przez Atlassian do zarządzania poważnymi incydentami.
Poznaj proces informowania o incydentach za pomocą Statuspage
W tym samouczku pokażemy, jak wykorzystać szablony dotyczące incydentów do skutecznej komunikacji w trakcie awarii. Ich elastyczny charakter pozwala na dostosowanie ich do różnego rodzaju przerw w dostawie usług.
Przeczytaj ten samouczekZnaczenie procesu analizy post-mortem incydentu
Analiza post-mortem incydentu, nazywana również przeglądem po incydencie, jest najlepszym sposobem na podsumowanie tego, co zdarzyło się w trakcie incydentu, i wyciągnięcia wniosków.
Przeczytaj ten artykuł