Close

빠른 속도의 팀을 위한 인시던트 관리

더 나은 인시던트 타임라인 만들기(및 중요한 이유)

기술이 더욱 복잡해지면서 인시던트 관리도 복잡해지고 있습니다. 인시던트 관리가 더욱 복잡해지면서 문서화 및 커뮤니케이션도 복잡해지고 있습니다.

그렇기 때문에 점점 더 많은 회사에서는 인시던트 타임라인을 이용하고 있습니다. 인시던트 타임라인은 인시던트 발생 시 팀이 동일한 정보를 공유하고, 똑같은 팀이 인시던트 발생 후 근본 원인을 파악하고 향후 성과를 개선하는 데 사용할 수 있는 기록을 제공하도록 설계된 중앙 집중식 인시던트 활동 피드입니다.

인시던트 타임라인이란 무엇입니까?

인시던트 타임라인은 인시던트에 대한 완전한 실시간 기록입니다. 여기에는 수동 입력(채팅), 페이지, 알림 및 승인의 통합 기록, 자동 시스템 업데이트(예: 누군가가 인시던트의 심각도 수준을 변경했거나 해결됨으로 표시했다는 알림)가 포함됩니다. 채팅 또는 Slack 채널과 동기화되기도 합니다.

타임라인의 목적은 팀이 동일한 정보를 공유하고, 새로운 팀원을 빠르게 투입하고, 인시던트 사후 검토 프로세스를 단순화하기 위한 것입니다. 인시던트 타임라인에는 전체 컨텍스트와 함께 인시던트 해결의 전체 범위를 반영해야 하기 때문에, Atlassian의 인시던트 관리 솔루션인 Jira Service Management는 작업 추적을 위한 맞춤형 플랫폼으로 견고한 타임라인을 만들어줍니다. 중앙 집중식 알림, 유연한 자동화, 통합 채팅 도구, 협업 작업 스페이스와 같은 기능을 통해, 팀이 원활하게 인시던트를 해결하는 동안 인시던트 타임라인이 자동으로 기록됩니다.

“예를 들어 3일 동안 이루어진 모든 변경 사항의 목록을 달라고 했을 때, 정확한 타임라인이 없다면 원인과 결과를 확인할 수 없어서 결국 또다른 중단이 발생할 것입니다.”

— “The Phoenix Project”,
Gene Kim, Kevin Behr, George Spafford

인시던트 타임라인의 가치

하나의 실시간 보기

인시던트가 통제를 벗어나는 가장 빠른 방법은 팀 또는 이해 관계자 간의 커뮤니케이션 부족입니다. 인시던트 타임라인은 모두에게 동일한 정보를 하나의 실시간 보기로 제공하여 이 위험을 완화합니다. 즉, 인시던트 해결을 위해 노력하는 개발자부터 사용자에게 최신 내용을 업데이트할 책임이 있는 커뮤니케이션 팀과 경영진 이해 관계자에 이르기까지, 모두가 복잡하게 전화를 주고받거나 단절된 여러 이메일 스레드, 전화 통화 및 채팅을 하는 일 없이도 빠른 속도를 유지할 수 있습니다.

또한 하나의 실시간 보기를 통해, 이해 관계자는 인시던트의 핵심 문제뿐만 아니라 상호 연결된 시스템의 위험 및 잠재적인 문제를 더 쉽게 파악할 수 있습니다. 여러 팀이 타임라인에 액세스할 수 있도록 하면 상호 연결된 시스템에서 잠재적인 문제, 원인 또는 위험을 파악하는 일이 더 쉬워집니다.

더 강력한 인시던트 사후 분석

Atlassian에서 인시던트 사후 분석은 인시던트 및 문제 관리 프로세스의 필수적인 부분입니다. 사후 분석에서는 관계자가 모여 어떤 일이 일어났는지, 왜 일어났는지, 미래에 그런 일이 일어나지 않도록 대비할 수 있는 일을 파악합니다. 이 질문의 핵심에 도달하려면 알림부터 이해 관계자 업데이트, 최종 수정에 이르기까지 인시던트 중에 발생한 모든 일에 대한 자세한 기록을 확보하면 도움이 됩니다.

많은 회사에서 인시던트 타임라인은 자세한 기록으로서 사용됩니다. 인시던트에 대한 실시간 공동 작업을 위한 도구일 뿐만 아니라, 사후 검토 단계에서 팀의 시간을 절약해주는 정보, 즉 어떤 일이 언제, 때로는 왜 일어났는지에 대한 하나의 보기 역할도 해줍니다.

KPI에 대한 더 심층적인 분석

인시던트 타임라인으로 팀이 단일 인시던트의 핵심에 도달할 수 있는 경우가 많지만, 그 유용성은 여기서 그치지 않습니다. 비슷한 인시던트의 타임라인과 함께 사용하면 팀이 패턴을 파악하고 중요한 KPI로 더 큰 문제를 진단할 수도 있습니다.

인시던트를 해결하는 데 평균보다 오래 걸렸다면 실패 지점은 어디였습니까? 다른 비슷한 인시던트와 어떻게 비교됩니까? 프로세스의 어느 부분을 자세히 살펴봐야 합니까? 프로세스, 기술 또는 팀 설정과 관련하여 더 큰 문제로 이어질 수 있는 패턴이 있습니까? 알림이 필요에 따라 전송되고 있습니까, 아니면 알림 임계값을 다시 검토해야 합니까? 대기 일정이 인시던트에 충분한 지원 범위를 제공합니까? 팀이 올바른 방식으로 구성되어 있습니까?

타임라인은 검토를 위한 단일 데이터 요소, 또는 SLA 및 SLO 문제에 대한 조사에서 여러 데이터 요소로 사용할 수 있습니다.

인시던트 타임라인과 ChatOps 비교

인시던트 타임라인은 일반적으로 모든 인시던트 정보를 중앙 집중식으로 처리하기 위해 Jira Service Management와 같은 인시던트 관리 시스템 내에서 제공 및 사용됩니다.

인시던트 관리를 위한 ChatOps의 목표도 같습니다. 유일한 차이점은, ChatOps는 인시던트 관리 시스템에 위치하는 대신 일반적으로 Slack과 같은 채팅 프로그램에서 타임라인을 중앙 집중식으로 처리한다는 것입니다. Slack은 Opsgenie와 같은 인시던트 관리 플랫폼 및 기타 관련 소스와 동기화하고 정보를 가져옵니다.

ChatOps의 이점, 즉 팀 전체에서 동일한 정보에 액세스하고, 실시간으로 대화 및 업데이트하고, 컨텍스트 전환을 줄이고, 더 이상 전화를 주고받지 않는 것, 그리고 사후 검토에 대한 내장 기록이 제공하는 이점은 인시던트 타임라인이 약속하는 것과 동일한 이점입니다. 핵심적인 차이점은 단순히 정보의 위치와 양입니다. 대부분의 인시던트 팀에서 ChatOps 피드에는 일반적으로 중요한 정보를 둘러싼 많은 잡음이 있습니다. 인시던트 타임라인에 풍부한 세부 정보를 가져오고, 나중에 필요할 때 참조할 수 있도록 채팅 로그를 보관하면 유용합니다.

팀에서 인시던트 해결을 위해 ChatOps를 이용하고 Jira Service Management의 인시던트 관리 기능을 활용할 수 있는 방법에 대해 자세히 알아보려면 아래 버튼을 참고하세요.

Up Next
5 whys