Управление инцидентами для высокоскоростных команд
Подготовка к проведению и проведение собрания по разбору инцидента
Собрание по разбору инцидента проводится после его устранения. На нем реагирующие лица и заинтересованные стороны могут проанализировать случившееся. Это важная часть общего процесса разбора.
Собрание по разбору не следует путать с отчетом по разбору, который обычно оформляется в виде документа. В нем перечислены действия, определенные в результате собрания по разбору.
Эти две составляющие части нередко употребляются синонимично. Под «разбором» может подразумеваться как собрание, так и отчет (либо и то, и другое).
В компании Atlassian под словосочетанием «разбор инцидента», как правило, понимают весь процесс анализа инцидента после его разрешения, в том числе:
- проведение собрания по разбору инцидента;
- фиксирование действий и информации во время собрания;
- получение подтверждения относительно последующих действий и обнародование результатов собрания.
Подробнее об управлении разборами в Atlassian см. в справочнике по управлению инцидентами.
Шаблон приглашения на собрание по разбору инцидента
Чтобы собрание по разбору инцидента прошло успешно, нужно четко сформулировать ожидания и быть последовательными в коммуникации. Об этом нужно позаботиться задолго до самого собрания.
Ниже вы найдете шаблон, который можно использовать, чтобы пригласить участников на собрание по разбору инцидента. Этот шаблон используют в компании Atlassian. Найти его можно в справочнике по управлению инцидентами.
Присоединитесь к разбору инцидента <ссылка на инцидент> без поиска виновных, где мы <краткое описание инцидента>.
При разборе инцидента преследуются следующие цели: проанализировать все его возможные причины, задокументировать инцидент для использования в дальнейшей работе и выявления закономерностей, а также предпринять эффективные профилактические действия, чтобы уменьшить вероятность повторения инцидента либо смягчить его последствия, если ситуация все же повторится.
На этом собрании мы попытаемся определить основные причины и выработать действия по их устранению.
Цель собрания по разбору инцидента
Собрание по разбору поддерживает цели всего процесса разбора, объединяя людей для анализа инцидента. Процесс разбора направлен на то, чтобы помочь организации проанализировать все его возможные основные причины, задокументировать инцидент для использования в дальнейшей работе и выявления закономерностей, а также предпринять профилактические действия, чтобы уменьшить вероятность повторения инцидента либо смягчить его последствия, если ситуация все же повторится.
Как организовать хорошее собрание по разбору инцидента?
Пригласите нужных людей
На собрании должны присутствовать ключевые лица, ответные за инцидент, а также соответствующие заинтересованные лица со стороны затронутых сервисов и бизнеса. Если на собрании не присутствуют ответственные менеджеры команды разработчиков, пропустите вопрос об обязательствах по выполнению конкретных действий, поскольку у вас не будет достаточно контекста для принятия решений относительно приоритетов. Вместо этого после собрания свяжитесь с менеджерами, чтобы подтвердить их обязательства по выполнению действий, определенных в ходе совещания.
Ведите хорошие заметки, не отклоняйтесь от темы
На собрании приветствуются спонтанные разговоры, если они не слишком сильно отклоняются от основной темы. Именно поэтому полезно заранее подготовить хронологию инцидента. Кроме того, неплохо использовать логичный шаблон разбора.
Не допускайте упреков и поиска виновных
Многие компании, включая Atlassian, практикуют разборы без поиска виновных.
Такие разборы проводятся, чтобы повысить эффективность в дальнейшем, а не чтобы найти и наказать виновных.
Собрания по разбору инцидентов играют решающую роль в поддержке общего процесса анализа инцидентов.
Успех собрания по разбору определяется задолго до его начала. Например, он зависит от того, насколько корректно было составлено приглашение на собрание. Также успех зависит от факторов, присутствующих на каждом этапе собрания, и действий, которые будут приняты по результатам собрания.
Изучайте информирование об инцидентах с помощью Statuspage
В этом руководстве мы покажем, как использовать шаблоны инцидентов, чтобы наладить эффективную коммуникацию во время разрешения инцидента. Применимо ко многим видам технических сбоев.
Читать учебное руководствоВажность процесса разбора инцидентов
Разбор инцидента, или анализ результатов реагирования на инцидент, — это лучший способ проработать произошедшее и зафиксировать полученный опыт.
Читать статью