Close

YBIYRI가 상시 서비스를 가능하게 만드는 방법

조직이 상시 서비스를 지원하는 DevOps 문화를 만드는 방법

Krishna Sai의 얼굴 사진
Krishna Sai

엔지니어링 책임자, IT 솔루션


상시 가동 서비스의 특성상 애자일 및 DevOps 팀의 지속적인 대응이 필요합니다. 팀은 단일 인시던트에 대응하는 것 그 이상을 생각하고 팀 구조, 가치 및 도구를 정렬하여 운영 우수성이 핵심 역량이 되도록 해야 합니다.

상시 서비스의 어려움


14년 전에 처음 논의된 이후로, YBIYRI는 여전히 최신 개발 팀에게 해결 시간을 단축하고 운영 모범 사례를 확장하겠다는 약속을 지키도록 도전이 되고 있습니다. 안타깝게도 많은 팀은 여전히 스킬, 일정 및 프로세스를 장기적 성공을 위한 기반이 아닌 인시던트에 대한 대응으로 삼고 있습니다.

팀은 적절한 준비 없이 YBIYRI 문화로 이동하는 경우가 많으며, 첫 번째 주요 인시던트가 일어난 후에야 이것을 인식하게 됩니다. 그러나 대체로 “다시는 인시던트가 발생하면 안 된다”는 생각 때문에 일어나는 반응입니다. 이를 위해 안전 게이트, 체크포인트 및 기타 절차적인 오버헤드가 도입합니다. 또한 변경 검토 위원회와 주간 릴리스 검토가 팀 리추얼의 일부분이 됩니다. 가동 중단을 방지하기 위해 모든 변경 사항을 면밀히 조사합니다. 이렇게 하면 인시던트가 감소할 수는 있겠지만, 개발 속도와 제품 가속도가 느려질 수 있습니다. 더 민첩한 경쟁자가 훨씬 빠르게 움직일 수 있기 때문에, 경쟁력에서 약점이 될 수 있습니다.

상시 가동 서비스를 위한 팀 모범 사례


조직 로고
관련 자료

무료로 사용해보기

트로피 아이콘
솔루션 보기

인시던트 관리 및 대응 간소화

운영 준비성

YBIYRI 팀의 중요한 변화는 스프린트 계획 및 실행 주기의 일부로 운영 준비성을 포함하는 것입니다. 운영 준비성에는 다음이 포함될 수 있습니다.

  • 개발 중에 평균 감지 시간(MTTD) 및 평균 격리 시간(MTTI)을 최소화하는 높은 품질의 적절한 알림을 코드에 구축
  • 종속 서비스가 예상대로 작동하는지 확인하기 위한 모니터(해당하는 경우 합성 모니터 포함) 구축
  • 필요한 대시보드를 구축하고 모든 팀원에게 대시보드를 사용하도록 교육하는 데 시간을 할당
  • 스프린트 중에 대기 중 담당자 팀원이 다른 개발을 수행하지 않도록 확인
  • 롤백이 예상대로 작동하는지 확인하기 위해 서비스에 대한 “워(전쟁) 게임”을 계획
  • 이전 인시던트 검토에서 작업을 종료하도록 스프린트에서 작업 능력을 계획
  • 스프린트 주기의 일부분으로 보안(업그레이드/패치/롤링 자격 증명) 및 운영 문제 해결

이 모든 기능을 사용하려면 제품 소유자가 기능 개발 및 기능과 관련된 비즈니스 약속과 함께 서비스 수준 목표(SLO)를 이해하고 우선 순위를 적절히 지정해야 합니다.

인시던트 가치 포용

팀 수준에서 인시던트 가치를 수용하면 팀의 YBIYRI 여정을 위한 강력한 기반을 다질 수 있습니다. 인시던트 가치는 인시던트 대응 시 팀을 안내해 줍니다. 이 가치가 있어 상시 서비스 구축 및 운영을 둘러싼 지속 가능한 문화를 위한 강력한 기반이 완성됩니다. 인시던트 가치는 다음과 같은 목적으로 설계되었습니다.

  • 인시던트와 사후 검토에서 개인과 팀이 자율적으로 의사결정을 내릴 수 있도록 안내
  • 인시던트를 식별, 관리 및 학습하는 방법을 포함하는 일관된 팀 문화 구축
  • 인시던트 식별, 해결 및 반영의 각 부분에서 팀이 가져야 하는 자세를 정렬

인시던트 가치 플레이북은 인시던트 대응 중 팀 가치를 식별하고 이 가치를 일관적으로 실천하기 위한 계획을 수립하는 데 도움이 되는 훌륭한 안내를 제공합니다. 팀이 상태 모니터의 고객 중심성, 팀 단결력, 공통된 이해, 서비스 수준 또는 서비스 명령과 관련하여 어려움을 겪고 있는 경우 도움이 될 수 있습니다.

Atlassian에서는 팀 수준에서 다음과 같은 인시던트 가치를 수용합니다.

Atlassian 가치

단계 및 인시던트 가치

원칙

저울 위에서 균형을 이루는 하트 그래픽

진심과 균형을 담아 제품을 만든다

감지
Atlassian은 고객이 알기 전에 미리 파악

균형 잡힌 서비스를 제공하기 위해서는 고객보다 먼저 인시던트를 탐지하기 위한 효과적인 모니터링과 알림이 있어야 합니다. 최상의 모니터링을 통해 문제가 인시던트로 발전하기 전에 감지할 수 있습니다.

Atlassian 저지 그래픽

팀으로 플레이

대응
에스컬레이션하고, 에스컬레이션하고, 또 에스컬레이션

인시던트가 발생했을 때 Atlassian이 꼭 필요하지 않더라도 연락을 받아도 상관없습니다. 그러나 연락을 받아야 하는 인시던트가 발생했는데도 연락을 받지 못하면 안됩니다. 늘 질문에 대한 답을 갖고 있지 않기 때문에 '주저없이 에스컬레이션'합니다.

Atlassian 가치 그래픽

고객에게 !@#$를 삼가한다

복구
문제는 발생할 수 있지만 신속하게 해결

고객은 서비스가 중단된 원인에 대해 관심을 갖는 것이 아니라 Atlassian이 최대한 빨리 서비스를 복구하는 것에 관심이 있습니다. 주저하지 말고 신속하게 인시던트를 해결해야 고객에게 미치는 영향을 최소화할 수 있습니다.

헛소리 금지 로고

열린 회사, 헛소리는 하지 않는다

학습
언제나 비난하지 않음

인시던트는 상시 서비스 운영의 일부분입니다. Atlassian은 비난하는 대신 팀에서 책임을 지게 함으로써 서비스를 개선합니다.

개선을 나타내는 그래픽

스스로 변화의 중심이 된다

개선
같은 인시던트가 반복되지 않도록 하기

인시던트가 다시 발생하지 않도록 근본 원인을 파악합니다. 지정된 날짜에 구체적인 변경 조치를 수행할 수 있도록 최선을 다합니다.

상시 가동하는 엔터프라이즈를 위한 도구


상시 가동 서비스를 운영하는 회사에는 강력한 관행과 문화 이외에도 적합한 도구가 필요합니다. 숙련된 DevOps 관행을 보유한 팀은 애자일 프로젝트 계획 및 스프린트, CI/CD, 자동화, 고급 모니터링 및 알림 기능을 지원하는 도구를 사용합니다.

Opsgenie와 같은 최신 인시던트 관리 도구를 사용하면 가장 빠르게 응답할 수 있는 선호 알림 채널로 중요한 알림을 받을 수 있습니다. 또한 알림을 그룹화하여 여러 알림을 필터링하는 기능도 포함합니다(특히 단일 오류 또는 장애로 인해 여러 알림이 생성되는 경우). 알림 관리 도구는 팀의 개발 및 운영 리듬에 자연스럽게 맞도록 팀의 도구(예: 로그 관리, 충돌 보고)와 원활하게 통합되어야 합니다.

각 팀은 워크플로, 정책 및 이해 관계자 측면에서 서로 다릅니다. 알림 관리 도구는 대기 일정 및 회람 규칙을 사용자 지정하여 소스 및 페이로드를 기반으로 알림을 처리할 수 있어야 합니다. 알림은 대개 인시던트에 대해 에스컬레이션하도록 만들 수 있습니다. 이 도구는 자동으로 인시던트 관리자를 만들어 방해 요소 없이 인시던트를 관리해야 합니다. 그러면 커뮤니케이션 및 공동 작업 도구와의 통합을 통해 모든 정보를 편리하게 사용하여 워룸처럼 인시던트를 관리할 수 있습니다. 마지막으로, 도구는 성공적인 부분에 대한 인사이트를 확보하고 개선의 기회를 식별할 고급 보고 및 분석 기능을 제공해야 합니다. 알림의 출처, 팀의 응답 성과 및 대기 중 워크로드가 분산되는 방식을 파악해야 합니다.

결론...


상시 서비스는 최신 소비자에게 선호 사항이 아니라 필수가 되었습니다. 많은 기업에서는 이 요구를 충족하는 데 필요한 민첩성을 개발하기 위해 YBIYRI 문화를 채택하고 있습니다. 문제는 많은 기업이 이 속도를 유지하는 데 적절한 도구와 여기에 필요한 팀 구조/관행을 갖추고 있지 않다는 것입니다.

팀을 YBIYRI DevOps 문화로 전환하려는 경우 다음과 같은 몇 가지 단계를 거쳐야 합니다.

  • 팀이 애플리케이션 또는 서비스의 모든 개발 및 운영 단계를 소유할 수 있도록 준비
  • 스프린트 계획에서 SLO에 우선 순위가 지정되도록 제품 소유자와 정렬 확인
  • 인시던트 대응 시 팀의 행동을 안내하는 일련의 인시던트 가치를 수용
  • 신뢰할 수 있고 빠르며 유연한 Opsgenie와 같은 최신 알림 및 인시던트 관리 도구로 팀의 역량을 강화

무료 인시던트 관리 핸드북을 다운로드하고 Opsgenie를 무료로 시작하세요.

Krishna Sai
Krishna Sai

Krishna Sai는 Atlassian의 IT 솔루션 엔지니어링 책임자로, Atlassian, Groupon, Polycom을 포함한 여러 스타트업 및 기업에서 20년 이상의 엔지니어링/기술 리더십 경험을 보유하고 있습니다. 인도 벵갈루루에 거주하며 팀의 공동 작업 방식에 영향을 주는 제품을 만드는 데 열정을 가지고 있습니다.


이 기사 공유

여러분께 도움을 드릴 자료를 추천합니다.

이러한 리소스에 책갈피를 지정하여 DevOps 팀의 유형에 대해 알아보거나 Atlassian에서 DevOps에 대한 지속적인 업데이트를 확인하세요.

DevOps 일러스트레이션

DevOps 커뮤니티

DevOps 일러스트레이션

DevOps 학습 경로

맵 일러스트레이션

무료로 사용해보기

DevOps 뉴스레터 신청

Thank you for signing up