Gerenciamento de incidentes para equipes de alta velocidade
Gerenciamento de incidentes na era do DevOps
Aplicando princípios de comunicação aberta e sem repreensão às equipes de gerenciamento de incidentes
Não se pode repensar como criar, implementar e operar softwares sem repensar como responder aos incidentes.
Na palestra inspiradora de 2009, “10+ Implantações por dia: Dev e Ops Cooperation no Flickr," John Allspaw e Paul Hammond esboçaram a visão de um mundo onde desenvolvedores e equipes de operações de TI trabalham juntos e entregam com frequência. Na década seguinte, essa visão tomou forma como o movimento DevOps.
A natureza de DevOps depende de novas formas de responder a incidentes. Não é de se surpreender que o gerenciamento de incidentes tenha sido tão enfatizado na palestra de Allspaw e Hammond.
“O importante a perceber é que falhas vão acontecer”, disse Hammond na palestra. “Não é a questão de se, é a questão de quando”.
Ao contrário de estruturas como a ITIL, não há um documento 'oficial' de práticas recomendadas para a equipe de DevOps. Mas, em geral, podemos concordar que DevOps trata da entrega de valor comercial a uma empresa, dividindo silos organizacionais, aumentando a transparência e fomentando a comunicação aberta entre desenvolvedores e equipes de operações de TI.
Essa mesma cultura de transparência, visibilidade e aprendizado rápido estende-se ao gerenciamento de incidentes.
Por quê? Porque as primeiras e mais críticas etapas no gerenciamento de incidentes envolvem entender o que deu errado, fazer com que as pessoas certas trabalhem no problema e promover uma cultura sem repreensão.
O gerenciamento de incidentes de DevOps exige uma cultura de comunicação aberta e sem repreensão entre desenvolvedores e equipes de operações de TI. E o estabelecimento de processos leves que melhorem a confiabilidade dos serviços de TI, aumentem a satisfação do cliente e agreguem valor para a empresa. Um engenheiro de DevOps pode ajudar a implementar a cultura e as práticas de DevOps.
A ITIL, em comparação, é o conjunto prescrito de 26 processos, procedimentos, tarefas e listas de verificação desenvolvidos para melhorar práticas específicas no gerenciamento de serviços de TI. A ITIL concentra-se na qualidade e na consistência do serviço e na melhoria da resiliência dos sistemas.
Um dos benefícios da ITIL é que as empresas que querem melhorar o ITSM podem começar com um modelo de práticas recomendadas em vez de começar do zero. E embora alguns acreditem que a ITIL é mais adequada para grandes empresas, a estrutura é flexível o suficiente para que empresas menores possam escolher os processos mais interessantes para seus negócios e também encontrar valor.
Uma desvantagem da ITIL, se você está com pressa para mudar o processo de resposta a incidentes, é que ela pode envolver o gerenciamento formal de mudanças e um consultor especializado, atrasando as melhorias.
Para as equipes que querem começar de imediato, a abordagem de gerenciamento de incidentes de DevOps pode ajudar a fazer a mudança e a obter benefícios imediatos.
Configuração de um on-call schedule com o Opsgenie
Neste tutorial, aprenda a configurar um on-call schedule, aplicar regras de substituição, configurar notificações de plantão e muito mais. Tudo no Opsgenie.
Leia este tutorialPráticas recomendadas da comunicação de incidentes
A comunicação de incidentes é o processo de alertar os usuários de que algum serviço está passando por algum tipo de interrupção ou teve queda no desempenho.
Leia este artigo