빠른 속도의 팀을 위한 인시던트 관리
Atlassian 인시던트 핸드북
오늘날 사용자는 기술 서비스 운영 팀이 연중무휴 서비스를 제공할 것을 기대하고 있습니다.
장애 또는 기능 오류 등의 문제가 발생하면 팀원은 즉각 이에 대응하고 서비스를 복원해야 합니다. 이 프로세스를 인시던트 관리라고 하는데, 이는 크든 작든 모든 회사에서 아직도 해결되지 않은 복잡한 과제로 자리잡았습니다.
Atlassian은 전 세계의 팀이 인시던트 관리를 개선할 수 있도록 도움을 드리고 싶습니다. Atlassian 인시던트 관리 프로세스를 요약한 이 핸드북은 Google과 같은 팀에서 영감을 받아 작성되었습니다. Atlassian에서 십여 년간 인시던트에 대응하면서 얻은 교훈이 포함되어 있습니다. 이는 Atlassian의 고유한 경험을 바탕으로 하지만, 적절히 조정하여 도입하면 팀의 요구 사항을 충족할 수 있을 것입니다.
핸드북 인쇄 버전 또는 PDF 받기
무료로 제공되는 인시던트 관리 핸드북의 인쇄 버전은 한정되어 있습니다. 또는 PDF 버전을 다운로드하세요.
Atlassian은 전 세계의 팀이 인시던트 관리를 개선할 수 있도록 도움을 드리고 싶습니다. Atlassian 인시던트 관리 프로세스를 요약한 이 핸드북은 Google과 같은 팀에서 영감을 받아 작성되었습니다. Atlassian에서 십여 년간 인시던트에 대응하면서 얻은 교훈이 포함되어 있습니다. 이는 Atlassian의 고유한 경험을 바탕으로 하지만, 적절히 조정하여 도입하면 팀의 요구 사항을 충족할 수 있을 것입니다.
스테이지 | 인시던트 가치 | 관련 Atlassian 가치 | 원칙 |
1. 감지 | Atlassian은 고객이 알기 전에 미리 파악한다 | 진심과 균형 | 균형 잡힌 서비스를 제공하기 위해서는 고객보다 먼저 인시던트를 감지하기 위한 충분한 모니터링과 알림이 있어야 합니다. 최상의 모니터링을 통해 문제가 인시던트로 발전하기 전에 감지할 수 있습니다. |
2. 대응 | 에스컬레이션하고, 에스컬레이션하고, 또 에스컬레이션 | 하나의 팀으로 플레이한다 | 아무도 자다가 일어나는 것을 좋아하지 않으며, Atlassian은 맡은 책임을 가볍게 받아들이지 않습니다. 하지만 알고 보니 깰 필요가 없었던 인시던트 때문에 잠에서 깨게 되는 경우도 있다는 것을 알고 있습니다. 일반적으로 더 어려운 상황은, 주요 인시던트 때문에 잠에서 깨고 더 일찍 알림을 받지 못한 채로 인시던트를 파악해야 하는 경우입니다. 우리는 늘 모든 문제에 대한 답을 갖고 있지 않기 때문에 '주저없이 에스컬레이션'해야 합니다. |
3. 복구 | 문제가 발생하면 신속하고 완전하게 해결한다 | 고객에게 문제를 안기지 않는다 | 고객은 서비스가 중단된 원인에 대해 관심을 갖는 것이 아니라 우리가 최대한 빨리 서비스를 복구하는 것에만 관심이 있습니다. 주저하지 말고 신속하게 인시던트를 해결해야 고객에게 미치는 영향을 최소화할 수 있습니다. |
4. 학습 | 비난하지 않는다 | 투명하고 개방적인 기업 | 서비스를 운영하면 인시던트는 불가피하게 발생합니다. 우리는 팀을 비난하는 대신 팀에서 책임을 지게 함으로써 서비스를 개선합니다. |
5. 개선 | 동일한 인시던트가 반복되어서는 절대 안 된다 | 스스로 변화의 중심이 된다 | 근본 원인을 밝히고 전체 인시던트 클래스가 다시 발생하지 않게 하는 변경 조치를 찾습니다. 특정 날짜에 구체적인 변경 조치를 수행할 수 있도록 최선을 다합니다. |