Zarządzanie incydentami dla dynamicznych zespołów
Podręcznik firmy Atlassian na temat zdarzeń
Obecnie od zespołów świadczących usługi techniczne oczekuje się całodobowej gotowości.
Gdy coś pójdzie nie tak, na przykład nastąpi przerwa w dostawie prądu lub jakaś funkcja przestanie działać, członkowie zespołu muszą reagować natychmiast, przywracając prawidłowe funkcjonowanie usługi. Proces ten jest określany jako zarządzanie zdarzeniami i jest zawsze trudnym wyzwaniem dla małych i dużych przedsiębiorstw.
Chcemy pomagać zespołom na całym świecie w ulepszaniu ich działań w zakresie zarządzania incydentami. Inspirując się praktykami zespołów firmy Google, opracowaliśmy niniejszy podręcznik będący streszczeniem procesu zarządzania zdarzeniami w firmie Atlassian. Zawiera on wnioski, które wyciągnęliśmy w ciągu ponad dekady reagowania na incydenty. Choć powstał na bazie naszych unikatowych doświadczeń, wierzymy, że można go zaadaptować do potrzeb własnego zespołu.
Uzyskaj podręcznik w formie drukowanej lub jako plik PDF
Oferujemy limitowaną pulę drukowanych wersji Podręcznika zarządzania incydentami, który wysyłamy za darmo. Możesz również pobrać wersję PDF.
Chcemy pomagać zespołom na całym świecie w ulepszaniu ich działań w zakresie zarządzania incydentami. Inspirując się praktykami zespołów firmy Google, opracowaliśmy niniejszy podręcznik będący streszczeniem procesu zarządzania zdarzeniami w firmie Atlassian. Zawiera on wnioski, które wyciągnęliśmy w ciągu ponad dekady reagowania na incydenty. Choć powstał na bazie naszych unikatowych doświadczeń, wierzymy, że można go zaadaptować do potrzeb własnego zespołu.
Etap | Wartość dotycząca zdarzeń | Powiązana wartość przedsiębiorstwa Atlassian | Przesłanki |
1. Wykrywanie | Atlassian wie wcześniej niż nasi klienci | Tworzona z sercem i harmonią | Zrównoważone usługi obejmują odpowiedni poziom monitorowania i powiadamiania, aby wykrywać incydenty, zanim zrobią to klienci. Optymalne monitorowanie pozwala ostrzegać o problemach, nim przekształcą się w zdarzenia. |
2. Reagowanie | Eskalacja, eskalacja, eskalacja | Play, as a team | Nikt nie lubi, gdy się go budzi, jednak my poważnie traktujemy nasze obowiązki. Ludzie rozumieją, że czasami może się zdarzyć, iż ktoś obudzi ich z powodu incydentu, choć ostatecznie ich obecność nie będzie konieczna. Zazwyczaj trudniej jest obudzić się z powodu poważnego incydentu i wdrożyć w sytuację, gdy nie otrzyma się alertu odpowiednio wcześniej. Nie zawsze będziemy umieli odpowiedzieć na wszystkie pytania, więc „nie wahaj się, tylko eskaluj”. |
3. Przywracanie | Wpadki się zdarzają, trzeba po nich szybko posprzątać | Nie !@#$ klienta | Nasi klienci nie dbają o to, dlaczego usługa nie działa. Chcą, aby jak najszybciej zaczęła poprawnie funkcjonować. Nigdy nie wahaj się przed doprowadzeniem do szybkiego rozwiązania incydentu. Dzięki temu będziemy mogli zminimalizować jego skutki dla naszych klientów. |
4. Uczenie się | Zawsze bez dociekania winy | Otwarta firma, bez nonsensów | Zdarzenia są elementem świadczenia usług. Ulepszamy usługi, czyniąc zespoły odpowiedzialnymi, a nie obarczając je winą. |
5. Ulepszanie | Nie dopuszczaj do ponownego wystąpienia tego samego zdarzenia | Dokonaj zmiany, której poszukujesz | Zidentyfikuj główną przyczynę i określ zmiany, które zapobiegną ponownemu wystąpieniu całej klasy zdarzeń. Zadeklaruj wprowadzenie konkretnych zmian w ustalonym terminie. |
Konfigurowanie harmonogramu dyżurów domowych za pomocą Opsgenie
W tym samouczku nauczysz się konfigurować harmonogram dyżurów domowych, stosować reguły zastępujące, ustawiać powiadomienia o dyżurach domowych oraz wykonywać inne czynności w Opsgenie.
Przeczytaj ten samouczekNasz sposób reagowania na incydenty
Oto realizowany w firmie Atlassian proces reagowania na incydenty, opisany w naszym podręczniku. Poznaj działania podejmowane przez menedżera ds. incydentów — od wykrycia do rozwiązania.
Przeczytaj ten artykuł