CheckOps em ação
As equipes podem fazer CheckOps pelo Compass, que oferece um lugar unificado onde elas podem ver com facilidade as métricas e metas e anotar as ações que planejaram.
Um exemplo de relatório semanal de CheckOps com métricas, alertas e ações planejadas.
Você também pode publicar um relatório semanal de CheckOps no Trello.
O que você vai precisar
Remoto
Videoconferência com compartilhamento de tela
Ferramenta de colaboração digital
Presencial
Template de relatório de CheckOps no Compass
Quadro branco
Marcadores
Notas adesivas
Temporizador
Templates opcionais
Templates da Atlassian
Esta tática funciona melhor com a função CheckOps no Compass (veja como ajudar a equipe a começar a fazer CheckOps). Mesmo que você ainda não use o Compass, pode começar a monitorar a saúde da equipe hoje mesmo no Trello.
Instruções para executar esta tática
Esta tática foi projetada para equipes que desenvolvem, entregam e executam software.
1. Preparar a prática 30 min
Defina as metas da equipe de DevOps
Toda a equipe vai estabelecer metas em conjunto.
- Entre no Compass e navegue até a função CheckOps ou prepare uma alternativa para monitorar as metas.
- Identifique o que você quer alterar ou melhorar nas práticas operacionais ou de desenvolvimento.
Os requisitos de negócios podem orientar os objetivos operacionais:
- Você precisa disponibilizar o serviço mais rápido possível aos clientes ou precisa estar disponível 24 horas por dia, 7 dias por semana, 365 dias por ano? Defina metas de DevOps para latência, taxa de transferência ou disponibilidade.
Os objetivos operacionais também podem vir da equipe:
- A equipe está cansada de ser acordada em horários estranhos da noite com alertas e incidentes sobre os quais não pode fazer nada? Estabeleça uma meta para minimizar o número de incidentes e alertas impraticáveis.
- Você acha que está esperando muito tempo para que as pull requests sejam analisadas? Defina um objetivo operacional de quanto tempo as pull requests vão ficar abertas.
Comece com um pequeno número de metas de DevOps. Mantenha a simplicidade e colete as informações certas para acompanhar o progresso que você está fazendo. Se puder, comece com a mesma meta ou metas em todos os serviços para facilitar o foco nos dados que a equipe vai analisar em cada reunião.
Garanta que as metas de DevOps sejam mensuráveis
Defina as metas que possam ser medidas para saber se elas, de fato, foram atingidas ou não.
- As métricas operacionais de serviços são a melhor opção aqui: use uma ferramenta de observabilidade (por exemplo, Splunk Observability, DataDog, Grafana etc.) e descreva com clareza a métrica que você quer afetar.
- As métricas de desenvolvimento para repositórios também são importantes. Você pode usar o Jira Software ou o Compass para fazer o monitoramento delas da melhor maneira.
Ao fazer esse exercício, você pode perceber que não está medindo o que quer melhorar de fato. Tudo bem! Um dos itens de ação para a primeira reunião de CheckOps pode ser adicionar a métrica DevOps relevante. Assim, ela vai poder ser apresentada em futuras reuniões.
Anote as metas de DevOps
Quando a equipe estiver de acordo com as metas que você definiu, anote e compartilhe com todos — esses são os objetivos operacionais declarados que você tem. Em seguida, configure um documento básico do Confluence que seja acessível e bem visível e armazene as metas de DevOps lá. Se trabalhar no Compass, você pode definir metas em indicadores de desempenho.
As metas de DevOps podem (e devem) mudar com o tempo. Ao coletar mais informações, você pode tomar decisões mais informadas sobre as metas estabelecidas ou pode descobrir que os objetivos comerciais ou operacionais que você tem evoluem. No entanto, tome cuidado para não adicionar muitas metas e métricas de DevOps de uma só vez, pois você pode acabar desviando o foco da equipe e não conseguindo alcançar os resultados que busca. É recomendado ter no máximo três metas dentro de um período de três a seis meses.
Alguns exemplos de metas que a equipe pode escolher incluem:
- Aumentar o pull request ou o tempo total do ciclo (TCT): útil se a equipe costuma perder prazos.
- Reduzir o número de alertas ou incidentes que a equipe registra a cada semana: útil se o trabalho da equipe for interrompido com muita frequência.
- Diminuir a frequência de implementação: útil se a equipe receber muitos incidentes.
Quando a equipe se torna mais saudável, você percebe que a fase de preparação fica mais curta.
DICA: PRINCIPAIS MÉTRICAS DE DEVOPS
É recomendado que as equipes sempre avaliem as seguintes métricas:
- Tempo de espera para mudanças
- Alterar taxa de falhas
- Frequência de implementação
- Tempo médio de recuperação
2. Coletar dados 15 min
Depois que a equipe definir metas, o apresentador precisa coletar dados. Não se esqueça de que, embora talvez não seja necessário executar a primeira etapa toda semana, vai ser preciso coletar dados todas as semanas.
Mantenha um registro
De uma reunião de CheckOps até a próxima, vão acontecer eventos relevantes que as ferramentas não conseguem capturar. Dada a falibilidade da memória humana, vale a pena anotar essas informações para que elas possam ser abordadas na reunião seguinte.
Se você estiver em uma equipe remota, crie um relatório de CheckOps para cada semana para adicionar eventos relevantes e compartilhar com os membros certos da equipe. Se estiver usando o Compass, a plataforma DevEx da Atlassian, iniciar a prática de CheckOps é rápido e fácil na página de informações de saúde.
- O plantão foi acionado e descobriu que o alerta era um falso alarme? Esse tipo de situação com certeza afeta a experiência de desenvolvedor da equipe. Então, registre e compartilhe o caso com o grupo para poder fazer melhorias no futuro.
- Houve um incidente, uma falha na implementação ou um pull request que demorou muito para ser mesclado? Faça anotações rápidas ao longo da semana para que a equipe não precise reconstruir eventos a partir da memória mais tarde.
Fique pronto para a revisão
Quando a rotação do plantão terminar (ou logo depois), o apresentador deve preparar o relatório de CheckOps dessa rotação. Resumindo, o relatório deve incluir:
- Uma lista dos serviços/componentes para os quais você quer fazer CheckOps.
- A medição (em relação à meta) para cada um desses componentes.
- Um visto ou um X para saber se a meta foi atingida ou não.
- Um plano de mitigação para todos os objetivos não alcançados, assim como comentários do apresentador sobre o porquê de o objetivo não ter sido alcançado.
- Uma seção para capturar ações de acompanhamento.
- Um resumo de quaisquer outros eventos ou anomalias.
É fundamental que as ações de acompanhamento sejam capturadas no relatório de CheckOps. Caso contrário, você vai ter um relatório de status quando o que quiser for um ciclo de feedback que promova melhorias.
3. Organizar uma reunião de revisão de CheckOps 30 min
Todo mundo desempenha um papel
Promova a interação! Todos os membros da equipe de DevOps que estão em escala de plantão devem comparecer a essa reunião, e todos devem ter uma função:
- Apresentador: a pessoa que acabou de encerrar a rotação de plantão deve apresentar o relatório de CheckOps e as descobertas feitas. Se você não tiver tarefas de plantão na equipe, indique uma pessoa para fazer anotações sobre os eventos que acontecem durante a semana e que possa apresentar as descobertas durante o decorrer dos acontecimentos.
- Próximo plantão: essa pessoa deve prestar muita atenção às observações do apresentador, incluindo problemas que tenha visto ou possíveis áreas de risco que possam ocorrer novamente na próxima rotação de plantão.
- Líder: líder é a pessoa (ou pessoas) que ajuda a equipe a priorizar as ações e a garantir o acompanhamento. Quando surge uma ação que exija acompanhamento, o líder deve ajudar a garantir que a pessoa (ou pessoas) certas sejam donas da ação e sejam capazes de chegar até a solução.
- Outros membros da equipe de plantão e proprietários de componentes: essas são as pessoas que também estão na rotação do plantão e/ou estão familiarizadas com os serviços ou componentes em operação.
Compartilhe e discuta descobertas
O apresentador orientará a equipe em cada serviço/componente e compartilhará se as metas foram ou não atingidas e o motivo. Eles vão discutir quaisquer eventos operacionais ou anomalias que ocorreram em um determinado serviço, além de compartilhar suas observações e análises. O trabalho da equipe é fazer perguntas e ajudar a fornecer sugestões para ações de acompanhamento.
Trabalhe em conjunto para encontrar maneiras de garantir que todos os serviços/componentes da equipe de DevOps atendam às respectivas metas. Esse é um exercício para toda a equipe.
Anote as ações que cada membro da equipe tomará e crie tickets em seu backlog durante a reunião.
DICA: AJA, NÃO REAJA
Quando sua equipe é responsável por atingir os objetivos operacionais ou as metas de desenvolvimento, pode ser fácil cair na armadilha de ser reativa. Seja confiabilidade, velocidade de entrega ou qualidade de código, a abordagem baseada em dados que o CheckOps promove deve permitir que sua equipe atinja suas metas de DevOps, aprimore a experiência do desenvolvedor e melhore continuamente.
Acompanhamentos
Iteração
Sugerimos executar o CheckOps Play toda semana e alinhá-lo com a entrega do cronograma de plantão da sua equipe. As etapas 2 e 3 se repetem a cada semana, embora você não precise executar a etapa 1 toda semana. Conforme você conhece o Play, as etapas 1 e 2 ficarão mais curtas. Depois que sua equipe estiver executando o CheckOps Play por várias semanas, podem ocorrer oportunidades de expandir e evoluir sua prática para incluir outras áreas de foco. Por exemplo, você pode medir métricas de qualidade (como forma de verificação do código), métricas comerciais (como usuários ativos semanais de um determinado recurso) ou qualquer outra coisa que torne sua equipe mais saudável.
Reavalie seus objetivos operacionais
Com o tempo, os objetivos originais de DevOps que você definiu podem não atender mais às necessidades da equipe. Talvez as necessidades da empresa tenham mudado ou as metas tenham se tornado mais ou menos agressivas. Nesse caso, execute a primeira etapa, atualize os objetivos operacionais declarados e continue a prática. Você também pode expandir o escopo da prática de CheckOps, se necessário, para abranger mais serviços, componentes ou outros aspectos da prática operacional.
Automatize a geração de relatórios
À medida que seu escopo se expande, você descobrirá que deseja dedicar mais tempo à análise e menos tempo aos relatórios. Encontre maneiras de automatizar a coleta das principais métricas e a geração de seus relatórios de CheckOps. Isso melhorará a produtividade e a experiência do desenvolvedor da sua equipe à medida que a geração de relatórios fica mais automatizada.
Se você adicionar automação, verifique se ainda está reservando um tempo para analisar os dados coletados e se preparando para a reunião do CheckOps. A Equipe da Atlassian usa métricas do Compass para ajudar com isso, e integramos nossa experiência de CheckOps ao produto para ajudar você a fazer isso também.
Exemplos de objetivos operacionais
Reflexões
Confira alguns exemplos de objetivos operacionais nos quais sua equipe pode estruturar a prática de CheckOps, dependendo de suas responsabilidades:
Delivery types | Possible objectives |
---|---|
Microservice |
|
On-call team |
|
Software delivery |
|
Mobile application |
|
Mantenha-se atualizado
Receba as últimas dicas sobre táticas e vida profissional ao se inscrever em nossa newsletter.