Zarządzanie incydentami dla dynamicznych zespołów
Tworzenie raportów z analiz post-mortem
Dlaczego gromadzenie i dokumentowanie danych jest kluczem do procesu analizy post-mortem incydentu?
Analizę post-mortem można podzielić na dwa odrębne artefakty: spotkanie, na którym omawiany jest incydent, oraz raport z analizy post-mortem powstały jako wynik tego spotkania.
Te dwa rodzaje aktywności, czyli spotkanie oraz raport, często są zamiennie określane mianem „analizy post-mortem”. Posługując się tym pojęciem, ludzie mogą mieć na myśli jeden z tych elementów lub obydwa.
Chcesz zacząć od szablonu analizy post-mortem? Zapoznaj się z naszymi szablonami analizy post-mortem.
Jest jednak różnica między spotkaniem post-mortem a pisemnym raportem z analizy post-mortem.
W Atlassian pod pojęciem analizy post-mortem lub analizy post-mortem incydentu rozumiemy zasadniczo cały proces analizowania incydentu, obejmujący:
- Prowadzenie spotkania post-mortem dotyczącego incydentu.
- Zarejestrowanie zgromadzonych informacji oraz działań podjętych w trakcie spotkania.
- Uzyskanie zgody na podjęcie kolejnych kroków i poinformowanie o wynikach spotkania.
Więcej informacji na temat sposobów zarządzania analizami post-mortem w Atlassian znajdziesz w naszym Podręczniku zarządzania incydentami.
Składniki dobrego raportu z analizy post-mortem incydentu
Precyzyjne i spójne polecenia
Dobry raport powinien opierać się na czytelnej i spójnej strukturze ramowej. Skuteczne zespoły przeprowadzają każdą analizę post-mortem w oparciu o szablon, w którym uczestnicy odpowiadają na zbiór pytań lub poleceń.
Dzięki temu nie zapomina się o najważniejszych szczegółach. Pozwala to również uspójnić incydenty i pomaga zespołowi w identyfikowaniu wzorców, trendów oraz możliwości poprawy. Taka struktura ramowa może podlegać iteracjom i można ją z czasem ulepszać, jednak wszelkie wprowadzane zmiany powinny być celowe.
Bogactwo szczegółów i danych
Pola w dokumentacji analizy post-mortem nie są miejscami, w których można pomijać szczegóły lub pobieżnie opisywać zdarzenia. W tych miejscach należy podać bardzo szczegółowe i konkretne informacje. Nie pisz, że wystąpił skok w natężeniu ruchu, tylko podaj wskaźnik, który się zmienił oraz wartość jego zmiany. Nie pisz, że zespół był zdezorientowany, tylko zamieść konkretny cytat z historii czasu, w którym ktoś wyraził konsternację.
Inkluzywny i wolny od wskazywania winnych język
Podobnie jak wiele zespołów, w Atlassian praktykujemy analizy post-mortem bez wskazywania winnych. Ważne, aby spotkaniu i analizie incydentu nie towarzyszyło szukanie winnych. To samo dotyczy również treści raportu. Należy unikać sformułowań wskazujących konkretne osoby lub obarczających je winą.
Ważne pytania, które należy zadać w raporcie z analizy post-mortem
Poniżej przedstawiamy elementy zawarte w funkcji analizy post-mortem rozwiązania Opsgenie:
- Okres poprzedzający
Opisz okoliczności, które doprowadziły do tego incydentu.
- Usterka
Opisz, co nie działało zgodnie z oczekiwaniami.
- Wykrycie
Opisz, jak wykryto incydent.
- Główne przyczyny
Przeprowadź analizę „5 × dlaczego”, aby poznać rzeczywiste przyczyny incydentu.
- Ograniczenie skutków i rozwiązanie
Jakie kroki podjęto w celu rozwiązania tego incydentu?
- Wyciągnięte wnioski
Co poszło dobrze? Co można było zrobić lepiej? Jakie inne wnioski udało się wyciągnąć?
Więcej przykładowych pytań do uwzględnienia w raporcie post-mortem znajdziesz w naszym artykule na temat szablonów analizy post-mortem.
Inne elementy do uwzględnienia w raporcie z analizy post-mortem
- Zrzuty ekranu
Dołącz odpowiednie zrzuty ekranu, zwłaszcza te, które zostały wykonane przez zespół reagujący w trakcie awarii. Jakie zmiany zaobserwowano w produkcie? Jakie funkcje produktu nie działały w oczekiwany sposób?
- Zgłoszenia
Łącza do istotnych zgłoszeń powiązanych z incydentem.
- Opinie klientów
Czy pojawiły się jakieś opinie klientów na temat incydentu? Zazwyczaj zgłaszane są za pośrednictwem pomocy technicznej, mediów społecznościowych lub poczty e-mail. Nie musisz uwzględniać ich wszystkich.
- Wykresy i grafy
Jakie wizualizacje danych pomagają pokazać wpływ incydentu?
- Dane
Czy istnieją inne kluczowe dane dotyczące incydentu lub jego wpływu?
- Rozmowy na czacie
Jeśli zespół podczas reagowania korzysta z narzędzia czatu, takiego jak Slack, rozważ dołączenie wszelkich kluczowych komunikatów lub konwersacji z historii czatu.
- Osie czasu
Precyzyjna oś czasu stanowi doskonałą pomoc przy analizowaniu incydentu. Uwzględnij kluczowe zdarzenia, które miały miejsce w trakcie incydentu, wraz z ich znacznikami czasu.
Wewnętrzne i zewnętrzne raporty z analiz post-mortem
Niektóre organizacje decydują się na publikowanie powszechnie dostępnych wersji analiz post-mortem po incydentach, choć nie jest to częstą praktyką. Zwykle ma to miejsce w przypadku usług udostępnianych klientom na dużą skalę, których awaria dotyka wielu użytkowników. Czasami publikuje się pełny raport z analizy post-mortem jednak (co bardziej prawdopodobne) częściej jest to okrojona wersja raportu wewnętrznego. Zapewne konieczne jest usunięcie danych wrażliwych lub osobowych.
Jak profesjonaliści reagują na poważne incydenty?
Pobierz nasz bezpłatny podręcznik zarządzania incydentami. Poznaj wszystkie narzędzia i techniki używane przez Atlassian do zarządzania poważnymi incydentami.
Poznaj proces informowania o incydentach za pomocą Statuspage
W tym samouczku pokażemy, jak wykorzystać szablony dotyczące incydentów do skutecznej komunikacji w trakcie awarii. Ich elastyczny charakter pozwala na dostosowanie ich do różnego rodzaju przerw w dostawie usług.
Przeczytaj ten samouczekZnaczenie procesu analizy post-mortem incydentu
Analiza post-mortem incydentu, nazywana również przeglądem po incydencie, jest najlepszym sposobem na podsumowanie tego, co zdarzyło się w trakcie incydentu, i wyciągnięcia wniosków.
Przeczytaj ten artykuł