Imagine Learning + Atlassian
Imagine Learning, Opsgenie를 통해 불필요한 알림을 줄이고 알림 피로를 완화
업계
교육 기술
위치
유타 프로보
사용자 수
241
제품
Marketplace 앱
페이지 공유
Imagine Learning은 2004년에 설립된 교육 기술 회사로, 전통적인 교육의 효과를 보지 못하는 학생들을 대상으로 서비스를 제공합니다. 이 소프트웨어는 읽기, 쓰기 및 수학에 어려움을 겪을 수 있는 유치원부터 고등학교까지의 학생들을 위해 설계되었습니다. 학교는 학습에 어려움을 겪는 학생들의 요구 사항에 맞추고 이들이 학업에 성공할 수 있도록 돕기 위해 소프트웨어를 구입합니다.
알림 피로의 고통
Keith Smith는 이미 여러 해 동안 DevOps 분야에서 일한 후 Imagine Learning에 수석 사이트 신뢰성 엔지니어로 합류했습니다. 그는 Opsgenie를 포함한 다양한 인시던트 모니터링 도구에 익숙했습니다. Imagine Learning에는 많은 도구가 있지만 통합 및 효과적인 알림이 갖춰져 있지 않았습니다.
“[당시] 대기 중 팀은 이메일을 통해서만 알림 메시지를 받았고 불필요한 알림이 너무 많았습니다. 매일 새벽 1시에 일어나서 휴대폰을 보고 다시 잠자리에 들었습니다. 그래서 더 좋은 방법이 있다고 말하고자 결심했습니다.”
모든 불필요한 알림으로 인해 알림은 의미가 없었고 알림에 대해 조치를 취할 수 없었습니다. 이 프로세스는 완전히 사후 대응적이었고 인시던트 중에 팀이 효율적으로 커뮤니케이션을 할 수 있는 방법이 없었습니다.
“지원 통화량이 증가하여 문제가 있다는 것이 드러난 후 지원 담당자가 문제를 에스컬레이션하는 것이 사실상 유일한 커뮤니케이션 체인이었습니다. 고객이 우리에게 뭔가 잘못되었다고 말한 다음 해결하는 방식이었습니다.”
비즈니스 사례 만들기
Keith는 Opsgenie와 같은 도구를 구현해야 한다는 것을 알고 있었습니다. 고위 경영진을 위한 비즈니스 사례를 공식화해야 했는데, 이는 예상보다 쉬운 일인 것으로 밝혀졌습니다.
“업무를 시작한 지 2주 정도 되었을 때, 알림을 설정하고 메트릭을 살펴보고 있었습니다. 24시간 동안 시스템이 다운되었는데도 전혀 몰랐다는 것을 깨달았습니다.” 문제는 매우 빠르게 해결되었지만 24시간의 서비스 중단은 완전히 피할 수 있는 문제였습니다.
그는 또한 본질적으로 단일 장애 지점이 되었으며, 이는 500명 이상의 직원이 미국, 인도 및 아르헨티나 전역에 분산되어 있는 회사에서는 확장 가능하거나 지속 가능하지 않았습니다.
Opsgenie를 채택한 지 3개월 만에, 인시던트 건수가 900% 줄어들었습니다.
Keith Smith
수석 사이트 신뢰성 엔지니어
통합과 커뮤니케이션 개선은 회사의 성공에 필요한 인프라를 유지 관리하는 데 핵심이었습니다.
“제가 휴가라도 가면 이틀 동안 알림을 처리할 방법이 없었습니다. 그래서 저는 상사에게 가서 이 상황은 지속 가능하지 않다고 말했습니다. 문제가 발생하기 마련이었으며, 저는 이를 증명하기 위해 [24시간 시스템 중단 포함] 출처를 인용했습니다.”
이메일 알림이 대부분인 비효율적인 대기 중 일정, 문제에 대한 사후 대응적인 접근 방식 및 최신 인시던트 관리 플랫폼의 필요성을 뒷받침하는 메트릭을 근거로 강력하게 주장했으며 Imagine Learning은 Opsgenie를 통해 발전했습니다.
신뢰할 수 있는 알림
IT 스택과 통합할 수 있는 Opsgenie의 기능을 관리하는 20개 이상의 도구와 애플리케이션은 불필요한 알림을 줄이는 데 핵심이 되었습니다.
“소스를 OG에 연결하고 싶을 때마다, 그저 웹후크일 뿐이라도 경로가 있었습니다.”
Slack 및 Jira와의 긴밀한 통합은 이제 Imagine Learning에 자동화된 프로세스가 있음을 의미합니다. Opsgenie는 상태 페이지를 업데이트하고, Jira 티켓을 만들고, Slack 알림을 시작하고, 적시에 적절한 사람들을 잠에서 깨웁니다.
“이제 주요 인시던트는 일 년에 한 번 꼴로 발생하며, 점점 더 재미있는 일이 되어 가고 있습니다. 밤에 잠을 잘 수 있어서 다른 프로젝트를 진행하는 데 여유가 생겼습니다.”
Keith Smith
수석 사이트 신뢰성 엔지니어
“더 빠른 MTTR 외에도, 우리가 얻는 가장 큰 장점은 커뮤니케이션 기능입니다. 인시던트가 발생하자마자 고객에게, 그리고 전국 및 전 세계 사무소에 있는 500명의 직원에게 무슨 일이 일어나고 있는지 알려줍니다.”
Opsgenie를 사용한 후 마음의 평화
대기 중 일정을 공유하고 필요할 때만 잠에서 깨어나게 되면서, Keith는 작업을 다양화하고 대응에 걸리는 시간을 24~36시간에서 단 15분 이하로 줄일 수 있게 되었습니다.
Opsgenie를 통해 Keith는 MTTR을 줄이고 팀원들의 삶의 질을 향상시키는 효율적인 인시던트 관리 및 대기 중 프로세스를 만들 수 있었습니다. 소프트웨어 제품을 제공하는 회사의 경우 문제를 빠르게 해결하는 것이 가장 중요합니다. Opsgenie를 채택한 지 3개월 만에, 인시던트 건수가 900% 줄어들었습니다.
“이제 주요 인시던트는 일 년에 한 번 꼴로 발생하며, 점점 더 재미있는 일이 되어 가고 있습니다. 밤에 잠을 잘 수 있어서 다른 프로젝트를 진행하는 데 여유가 생겼습니다.”
지금 Opsgenie의 14일 무료 평가판을 시작하세요
Opsgenie를 통해 클라우드 중심의 비즈니스 지원
애자일 인시던트 관리를 통해 상시 서비스를 제공