Zarządzanie incydentami dla dynamicznych zespołów
Reagowanie na zdarzenia
W poniższych sekcjach opisano proces reagowania na zdarzenia w przedsiębiorstwie Atlassian. Kierownik ds. zdarzeń realizuje serię działań w celu doprowadzenia do usunięcia wykrytego zdarzenia.
Pole Jira | Typ | Tekst pomocy |
Podsumowanie | Tekst | Na czym polega awaria? |
Opis | Tekst | Jakie są skutki dla klientów? Podaj swoje dane kontaktowe, żeby osoby reagujące mogły się z Tobą skontaktować. |
Ważność | Wybór jednej opcji | (Hiperłącze do strony oprogramowania Confluence z zamieszczoną skalą ważności) Wybór opcji 2 lub 1 oznacza konieczność natychmiastowego rozwiązania problemu. Należy wezwać odpowiednie osoby). |
Usługa, która nie działa | Wybór jednej opcji | Usługa, w której wystąpiła usterka powodująca zdarzenie. W razie wątpliwości należy zgadywać. W przypadku braku wiedzy zaznaczyć opcję „Nieznana”. |
Produkty, których dotyczy zdarzenie | Pola wyboru | Których produktów dotyczy incydent? Zaznacz wszystkie pasujące. |
Po utworzeniu zdarzenia identyfikator zdarzenia jest używany we wszystkich wiadomościach wewnątrz przedsiębiorstwa dotyczących tego zdarzenia.
Klienci często żądają rozpoczęcia procedur świadczenia wsparcia odnośnie do zdarzenia, które ich dotyczy. Gdy nasz zespół ds. obsługi klientów ustali, że wszystkie te przypadki dotyczą zdarzenia, nadają im etykietę wraz z identyfikatorem zgłoszenia zdarzenia, aby śledzić jego skutki dla klientów i ułatwić sobie wyszukiwanie klientów po rozwiązaniu zdarzenia, które ich dotyczy.
Ważność | Opis | Przykłady |
1 | Zdarzenie krytyczne o bardzo poważnych skutkach |
|
2 | Ważne zdarzenie o znaczących skutkach |
|
3 | Mało istotne zdarzenie o niewielkich skutkach |
|
Po ustaleniu skutków zdarzenia, należy dostosować lub potwierdzić poziom ważności zgłoszenia zdarzenia i przekazać tę informację do zespołu. Jak wynika z naszych doświadczeń, określanie poziomów w liczbach jest bardzo przydatne z punktu widzenia komunikacji.
W firmie Atlassian zdarzenia o poziomie ważności 3 są przekazywane do zespołów ds. dostarczania usług w celu rozwiązania w godzinach pracy; zdarzenia o poziomie 1 i 2 wymagają wezwania członków zespołu w celu natychmiastowego rozwiązania. Różnica w reagowaniu na zdarzenia o wadze 1 i 2 jest subtelniejsza i zależy od usługi, jakiej dotyczy.
Wykres poziomu ważności należy udokumentować i uzyskać akceptację wszystkich zespołów, aby zapewnić spójność reagowania na zdarzenia na podstawie skutków odczuwanych przez klientów.
Wewnętrzna strona Statuspage | Zewnętrzna strona Statuspage | |
Nazwa zdarzenia | | Wyjaśnianie problemów z |
Komunikat | Wyjaśniamy zdarzenie dotyczące | Wyjaśniamy problem z działaniem |
Oprócz utworzenia zdarzenia w narzędziu Statuspage, wysyłamy wiadomość e-mail do odbiorców na liście dystrybucyjnej na potrzeby komunikacji w sprawie zdarzenia, na której znajdują się nasi kierownicy ds. inżynierii, kierownicy ds. poważnych zdarzeń i inni zainteresowani członkowie personelu. Wiadomość e-mail ma taką samą treść jak treść zdarzenia w wewnętrznym narzędziu Statuspage. Na wiadomość e-mail można odpowiedzieć i przesłać pytania, natomiast komunikacja za pośrednictwem narzędzia Statuspage jest raczej jednostronna.
Należy pamiętać, że zawsze dołączamy identyfikator zgłoszenia w systemie Jira do wszystkich wiadomości dotyczących zdarzenia wysyłanych wewnątrz przedsiębiorstwa, dlatego personel wie, do którego pokoju należy zajrzeć, aby uzyskać więcej informacji.
Konfigurowanie harmonogramu dyżurów domowych za pomocą Opsgenie
W tym samouczku nauczysz się konfigurować harmonogram dyżurów domowych, stosować reguły zastępujące, ustawiać powiadomienia o dyżurach domowych oraz wykonywać inne czynności w Opsgenie.
Przeczytaj ten samouczekAnalizy post-mortem: Usprawnienie procesów zarządzania incydentami
Dowiedz się, jak przeprowadzać skuteczne analizy post-mortem, aby usprawnić procesy zarządzania incydentami i zapobiec problemom w przyszłości.
Przeczytaj ten artykuł