Close

Odzyskiwanie awaryjne w przypadku produktów Atlassian Data Center

Strategia odzyskiwania awaryjnego jest kluczowym składnikiem każdego planu zapewnienia ciągłości działalności biznesowej. Opisuje procedury, których należy przestrzegać w przypadku awarii, aby firma mogła odzyskać sprawność i kontynuować działanie.

Na czym polega odzyskiwanie awaryjne?

W przypadku produktów Atlassian Data Center oznacza to zapewnienie dostępności w sytuacji, gdy instancja główna stanie się niedostępna. W naszych produktach Data Center zazwyczaj obejmuje to skonfigurowanie strategii zimnej rezerwy. Krótko mówiąc, produkty powinny działać nieprzerwanie, a strategia przejścia w tryb failover jest niezbędna do osiągnięcia wysokiej dostępności i planowania odzyskiwania awaryjnego.

Dzięki odzyskiwaniu awaryjnemu w przypadku produktów Atlassian Data Center można skonfigurować replikację indeksów, aktualizacje załączników i synchronizację bazy danych, aby zapewnić zgodność ze specyficznymi wymaganiami planu odzyskiwania awaryjnego.

Rodzaje planów odzyskiwania awaryjnego

Do incydentów IT może dojść w wyniku okoliczności naturalnych lub wywołanych przez człowieka, w tym zagrożeń cybernetycznych, błędów ludzkich, złego planowania oraz wadliwego sprzętu lub oprogramowania. Niezależnie od tego, jak dochodzi do awarii, przestoje powodują utratę wydajności i przychodów. Im większa organizacja, tym więcej zespołów jest uzależnionych od wyników stosowania planu odzyskiwania awaryjnego.

Plany odzyskiwania awaryjnego powinny być tworzone dla każdego narzędzia używanego w organizacji. Obejmuje to produkty samodzielnie zarządzane (takie jak produkty Atlassian Data Center) lub produkty hostowane w chmurze. W ostatnich latach popularność zyskały narzędzia typu odzyskiwanie awaryjne jako usługa (DRaaS), które zapewniają zewnętrzne usługi replikacji i hostingu, aby umożliwić przejście na tryb failover w innej lokalizacji.

W zależności od infrastruktury wykorzystywanej w organizację może być również konieczne utworzenie planu odzyskiwania awaryjnego, który obejmie fizyczne aspekty infrastruktury IT, infrastrukturę sieciową organizacji i wszelkie używane maszyny wirtualne.

Korzyści z wdrożenia planu odzyskiwania awaryjnego

Plan odzyskiwania awaryjnego to udokumentowany proces szybkiego odzyskiwania sprawności aplikacji biznesowych o znaczeniu krytycznym w następstwie awarii. Ale dopóki nie dojdzie do awarii, te plany są w dużej mierze teoretyczne.

Korzyści z wdrożenia planu odzyskiwania awaryjnego obejmują krótszy czas odzyskiwania i minimalizację możliwości przestojów lub utraty danych w obliczu awarii.

Trzy istotne elementy planu odzyskiwania awaryjnego to: docelowy punkt odzyskiwania (RPO), docelowy czas odzyskiwania (RTO) i docelowy koszt odzyskiwania (RCO).

Docelowy punkt odzyskiwania

Określa, jak aktualne mają być Twoje systemy po awarii lub na jaką stratę danych w wyniku awarii możesz sobie pozwolić.

Docelowy czas odzyskiwania

Określa, jak szybko po awarii ma być dostępny system rezerwowy.

Docelowy koszt odzyskiwania

Określa, ile zamierzasz wydać na rozwiązanie lub plan odzyskiwania awaryjnego.

Konfigurowanie produktów Data Center w celu wdrożenia strategii odzyskiwania awaryjnego

Zapewnij ciągłość działalności biznesowej i utrzymaj docelowy czas odzyskiwania — nawet w obliczu całkowitej awarii systemu lub lokalizacji — poprzez skonfigurowanie produktów Atlassian Data Center w celu wdrożenia strategii odzyskiwania awaryjnego. W wersjach Data Center produktów Jira, Confluence i Bitbucket Twój zespół może skonfigurować instancje zimnej rezerwy na wypadek awarii.

Na początku zespół tworzy system rezerwowy bez uruchamiania go. Następnie konieczne jest wdrożenie strategii replikacji danych. Replikacja danych do lokalizacji rezerwowej ma kluczowe znaczenie dla strategii zimnej rezerwy. Z pewnością nie chcesz przejść na tryb failover w instancji rezerwowej i dowiedzieć się, że jest nieaktualna lub że ponowne indeksowanie bazy danych zajmie wiele godzin.

Pamiętaj, że dopóki masz aktywną licencję Data Center, nie musisz kupować dodatkowych ani oddzielnych licencji, aby uruchomić produkty Jira, Confluence lub Bitbucket w instancji zimnej rezerwy.

Testowanie odzyskiwania awaryjnego

Zespoły służb ratunkowych, np. strażacy czy ratownicy medyczni, regularnie ćwiczą umiejętności ratownicze, więc dlaczego Twój zespół nie miałby postępować podobnie? Dzięki ćwiczeniom Twój zespół zyska doświadczenie i komfort działania w sytuacji dużego stresu, czego wynikiem będzie szybsze i skuteczniejsze rozwiązanie problemu.

W przypadku produktów Jira, Confluence i Bitbucket zalecamy odizolowanie danych produkcyjnych przed przeprowadzeniem jakichkolwiek testów odzyskiwania awaryjnego. Następnie sprawdź, czy system trybu failover jest gotowy, i uruchom aplikację. Nie zapomnij o monitorowaniu plików dziennika i sprawdzaniu problemów ze spójnością. Po zakończeniu testu zresetuj wdrożenie odzyskiwania awaryjnego, przywracając składniki systemu rezerwowego do stanu, w którym może nastąpić replikacja. W wielu przypadkach łatwiejsze może być ponowne skonfigurowanie infrastruktury rezerwowej.

Zapewnienie ciągłości działalności biznesowej a odzyskiwanie awaryjne

Zapewniania ciągłości działalności biznesowej i odzyskiwanie awaryjne to terminy często stosowane zamiennie, ale odnoszą się do różnych koncepcji.

Ciągłość działalności biznesowej

Planowanie zapewnienia ciągłości działalności biznesowej odnosi się do strategii, która pozwala organizacji działać z minimalnymi przestojami.

Pierwszym krokiem w planowaniu zapewnienia ciągłości działalności biznesowej jest opracowanie analizy wpływu na działalność biznesową, która powinna obejmować ocenę i ustalenie priorytetów funkcji biznesowych oraz identyfikację potencjalnych skutków awarii informatycznej. Analizy wpływu na działalność biznesową mogą również zawierać oszacowania maksymalnych dopuszczalnych przestojów i docelowych czasów odzyskiwania. Ważne jest, aby przeprowadzić analizę wpływu na działalność biznesową w celu zidentyfikowania potencjalnych zależności.

Ocena ryzyka jest kolejnym etapem tworzenia planu zapewnienia ciągłości działalności biznesowej. Korzystając z analizy wpływu na działalność biznesową, organizacja powinna zbadać zagrożenia i rozważyć prawdopodobieństwo oraz ważność potencjalnych awarii. Następnie organizacja może ustalić priorytet swoich procesów biznesowych i przeprowadzić analizę rozbieżności względem istniejących zasad. Oceny ryzyka mogą również wpływać na gotowość organizacji do wydawania pieniędzy w celu osiągnięcia lepszych wyników.

Odzyskiwanie awaryjne

Odzyskiwanie awaryjne to podzbiór strategii zapewnienia ciągłości działalności biznesowej odnoszący się do procesów, których organizacja musi przestrzegać w przypadku awarii, aby odzyskać sprawność i kontynuować działanie. Skuteczny plan odzyskiwania awaryjnego uwzględnia potrzeby zidentyfikowane w analizie wpływu na działalność biznesową i ocenie ryzyka.

Zasoby dotyczące odzyskiwania awaryjnego

Blog

Uprość odzyskiwanie awaryjne Git dzięki Bitbucket Data Center

Dokumentacja

Odzyskiwanie awaryjne w przypadku Atlassian Data Center

Dokumentacja

Przewodnik po odzyskiwaniu awaryjnym w systemie Jira

Planowanie z myślą o przyszłości

Dzięki produktom Atlassian Data Center możesz zapewnić ciągłość działalności biznesowej i utrzymać docelowy czas odzyskiwania nawet w obliczu całkowitej awarii systemu lub lokalizacji.