Gestión de incidentes para equipos de alta velocidad
Cómo llevar a cabo un análisis retrospectivo sin acusaciones
Análisis retrospectivos de incidentes centrados en el crecimiento, sin cruces de acusaciones
La mayoría de las empresas sufren incidentes graves al menos varias veces al año.
Podemos esforzarnos por prevenir los incidentes, mitigar sus consecuencias y acortar su duración, pero es poco probable que desaparezcan por completo en un futuro cercano.
La buena noticia es que los incidentes nos dan una oportunidad para aprender, para detectar vulnerabilidades en nuestros sistemas, para evitar que se repitan en el futuro, para perfeccionar nuestros procesos a fin de mitigar la repercusión de los incidentes, y para compilar un software de mayor calidad en el futuro.
La mejor manera de aprender de los incidentes es implantando análisis retrospectivos. Y, en Atlassian, nuestros análisis retrospectivos no buscan "culpables".
¿Qué es un análisis retrospectivo sin acusaciones?
Un análisis retrospectivo de los incidentes reúne a los equipos para analizar en mayor profundidad un incidente y averiguar qué es lo que ha pasado, por qué sucedió, cómo respondió el equipo y qué se puede hacer para evitar que se repitan los incidentes y mejorar las respuestas en el futuro.
Los análisis retrospectivos que no buscan culpables consiguen todo esto sin entrar en cruces de acusaciones.
En un análisis retrospectivo sin reproches, se presupone que todos los equipos y empleados actuaron con la mejor intención a partir de la información que tenían en ese momento. En lugar de buscar (y castigar) a quienquiera que haya metido la pata, los análisis retrospectivos sin reproches se centran en mejorar el desempeño laboral en el futuro.
En el manual de gestión de incidentes de Atlassian se puede leer lo siguiente:
Cuando algo va mal, la propensión humana natural es buscar a alguien a quien culpar. No obstante, en Atlassian lo que más nos interesa es evitar esta tendencia, por lo que cuando vayas a realizar un análisis retrospectivo, tienes que superarla de forma consciente. Presuponemos que nuestro personal tiene buenas intenciones y nunca culpamos de los fallos a las personas. El análisis retrospectivo debe examinar de manera objetiva y honesta las circunstancias que provocaron el fallo, de forma que podamos llegar a los orígenes reales del problema y mitigarlos.
Quienes abogan por este planteamiento (entre los que se encuentran empresas como Google y Etsy) afirman que fomenta una política corporativa de aprendizaje y, con el tiempo, mejora el rendimiento laboral. Asimismo, señalan que eliminar el componente de "caza de brujas" genera un cambio psicológico. En lugar de preocuparse por que los despidan o bajen de nivel y de intentar pasarse la patata caliente de la culpa, los equipos pueden centrarse en solucionar las incidencias subyacentes.
En el otro extremo, los detractores se preguntan si de verdad se pueden hacer análisis retrospectivos sin reproches (¿acaso no estamos los humanos programados para echar la culpa?). Además, les preocupa que este planteamiento no fomente que se asuman responsabilidades.
¿Son siquiera factibles los análisis retrospectivos sin acusaciones?
Una de las principales críticas que reciben los análisis retrospectivos sin reproches es que, simple y llanamente, son imposibles. Al fin y al cabo, echarse la culpa y criticarse son comportamientos naturales. La asunción de responsabilidades es un ingrediente fundamental para dirigir un buen equipo. Además, para los detractores, los análisis retrospectivos sin reproches son como una cena familiar incómoda: todo el mundo intenta sonreír y no decir lo que realmente piensa, pero solo se consigue a medias.
Estas críticas dan por sentado que el objetivo de los análisis retrospectivos sin reproches es hacer que los responsables de un incidente se sientan mejor (un objetivo que, de ser así, imposibilitaría conversar y asumir responsabilidades de verdad).
Sin embargo, el verdadero objetivo de los análisis retrospectivos sin reproches es eliminar el miedo a parecer incapaz, a las riñas o incluso a perder el trabajo. En última instancia, su finalidad es promover una comunicación sincera, objetiva y centrada en los hechos que propicie mejores resultados en el futuro.
Por ejemplo, pongamos que se ha producido un incidente porque el empleado A dio por sentado, incorrectamente, que el empleado B había implementado una corrección. En lugar de dedicar el análisis retrospectivo a averiguar si al final la culpa fue del empleado A o del B, en un análisis retrospectivo sin reproches, cada empleado repasaría sus decisiones y pasos de trabajo para intentar llegar a la raíz de la incidencia.
Al repasar el proceso, podemos identificar qué es lo que podemos mejorar. Quizá nuestros procesos formativos no funcionen. Tal vez la documentación fuera confusa. Quizás haya alguna forma de establecer formas en nuestros sistemas técnicos para que los empleados no tengan que recordar a quién tienen que consultar.
La cuestión no es que los análisis retrospectivos sin reproches no identifican nunca quién cometió un error, sino que la ausencia de reproche permite iniciar la comunicación y admite que los incidentes de TI son complejos y que puede haber varias formas de mejorar en el futuro, sin culpar ni despedir al empleado A.
Los beneficios de los análisis retrospectivos sin acusaciones
Para muchos, puede que los análisis retrospectivos sin reproches requieran un cambio en la política corporativa. Sin embargo, según nuestra experiencia, las ventajas superan el esfuerzo necesario para llevarlos a cabo. Análisis retrospectivos sin reproches
· Crean una buena política corporativa entre los equipos
Si no intentamos culpabilizar a otro equipo, seremos capaces de trabajar juntos con más eficacia, comunicarnos de forma clara y sin miedo, y ser empáticos con los equipos de nuestro alrededor.
· Reducen la posibilidad de que se ignoren los incidentes por temor a recibir las culpas
Si un incidente no da lugar a una culpabilización pública o un despido, es más probable que los empleados notifiquen todo lo relacionado con ese incidente, lo pongan en conocimiento del equipo y compartan ideas para encontrar soluciones en el futuro. Si existe la posibilidad de que pierdan el trabajo, sentirán la tentación de mantenerse callados y no informar de los errores.
· Crean una política de aprendizaje abierta y de mejora continua
Los análisis retrospectivos sin reproches animan a los equipos a hablar punto por punto sobre lo que salió mal y a hacer propuestas para mejorar. Además, suponen admitir que los incidentes son complicados y que todos somos humanos, lo cual posibilita que los empleados adopten el aprendizaje y el cambio en vez de defender sus decisiones por miedo a las consecuencias.
· Aumentan el apoyo mutuo y la comunicación
Si los empleados A y B no tienen que culparse mutuamente por una interrupción del servicio, es probable que su relación se afiance. Eliminar el miedo relaja la presión y da al personal la oportunidad de apoyarse mutuamente.
· Dan libertad a los equipos para dar lo mejor de sí mismos en el trabajo
Ver cómo se le echa la culpa a un compañero de equipo, se le achacan las culpas o incluso se le despide por un traspié mina la confianza del resto del equipo y genera temor a la hora de sacar adelante el trabajo. Además, puede ralentizar las operaciones y poner trabas para el progreso futuro.
Prácticas recomendadas para una política corporativa en la que no se busquen culpables
Para realizar de forma eficaz análisis retrospectivos sin reproches, lo primero es asentar las bases de una política corporativa en ese sentido. Para ello, hay que empezar por lo siguiente:
Transmite de antemano que este es un planteamiento abierto y que acepta los errores
Antes de que comience la reunión, procura que los equipos tengan presente que esto no es una "caza de brujas", sino una oportunidad para que la empresa aprenda y mejore. El personal puede sincerarse sobre lo que dieron por sentado, las expectativas incorrectas y sus errores sin miedo a las represalias.
Fomenta la sinceridad y la aceptación de los errores
Según los detractores, en los análisis retrospectivos sin reproches no se asume la suficiente responsabilidad, pero es aquí donde se equivocan. Tus análisis retrospectivos deberían fomentar la sinceridad y la asunción de responsabilidades. Eliminar el miedo a las consecuencias le da al personal libertad para comunicar con sinceridad sus equivocaciones y malentendidos. Y esa es la única forma de corregirlos.
Comparte información y desarrolla una cronología
Antes de ponerte a investigar un incidente, asegúrate de que todos estén de acuerdo sobre lo que sucedió en realidad. Si no se entiende bien la incidencia principal, el análisis retrospectivo del incidente puede descarrilar con rapidez. Por eso es tan importante desarrollar un cronograma del incidente.
No busques nunca culpables
Si en un análisis retrospectivo no se buscan culpables, pero en otros sí, no se erradicará el miedo ni se implantará una mayor apertura.
Logra la aceptación de los altos ejecutivos
Los análisis retrospectivos sin reproches obligarán a la mayoría de las organizaciones a cambiar su política corporativa. Antes de ponerte manos a la obra, procura sentarte con los responsables de la empresa para ayudarles a entender las ventajas que aportan los análisis retrospectivos y la política corporativa en los que no se buscan culpables. Solo se pueden introducir cambios en la política corporativa con la aprobación de los altos directivos.
Colabora
Incluso los equipos que no se vieron directamente afectados por el incidente pueden aprender de un análisis retrospectivo o aportar algo a este.
Invitar a diversos equipos a un análisis retrospectivo fomenta la colaboración entre equipos y pone sobre la mesa otros puntos de vista, lo que, en definitiva, mejora la gestión de los incidentes. Invitar a alguien del equipo de seguridad y privacidad, del jurídico, o del de riesgo y cumplimiento puede ayudar a identificar factores que antes se desconocían y otros riesgos ocultos en los procesos existentes, así como maneras en las que otros equipos puedan mejorar su apoyo a los sistemas y procesos técnicos.
Toma decisiones, pero recibe la autorización
Todo buen análisis retrospectivo sin reproches debería dar lugar a una serie de recomendaciones que contribuyan a prevenir incidentes en el futuro. Procura identificar quién está a cargo de aprobar las acciones recomendadas y de revisar su redacción propiamente dicha.
En Atlassian, esa persona es un responsable de ingeniería, a escala de división, que se encarga de revisar las conclusiones y priorizar las medidas y mitigaciones acordadas tras el análisis retrospectivo.
El caso de éxito de un análisis retrospectivo sin acusaciones
Entonces, ¿de verdad se mejoran los resultados gracias a los análisis retrospectivos sin reproches? Internamente en Atlassian, todos los indicios apuntan a que sí.
Hace un par de años, un ingeniero cometió un grave error en la sintaxis de un archivo de configuración en un componente de un equipamiento crítico, y dejó fuera de servicio a toda la empresa durante 45 minutos. Para hacerse una idea cuantitativa de lo que esto supuso, estamos hablando de cientos de miles de dólares.
Ahora bien, en lugar de culpar al ingeniero, hicimos un análisis retrospectivo sin reproches, ya que nuestro objetivo no era castigar a nadie por ningún error, sino averiguar si había alguna manera de impedir que ese error se repitiera en el futuro. Los seres humanos cometemos errores. No hay nada que podamos hacer para evitarlo. La pregunta es la siguiente: ¿cómo podemos reducir la probabilidad de que se dé un error humano? Y, para darle respuesta, debemos saber qué pasó y por qué.
Al final, la corrección, sencilla y permanente, consistió en meter una comprobación automatizada de inicialización en el archivo de configuración antes de cargarlo, y en acabar eliminando toda interacción humana con la configuración del sistema. En la actualidad, la incidencia causante de la interrupción del servicio se evita mediante una corrección técnica rápida. El ingeniero involucrado en el asunto sigue trabajando en Atlassian y su aportación a nuestro equipo es enorme.
En Atlassian profesamos verdadera devoción por los procesos sencillos y reproducibles (y nuestros análisis retrospectivos sin reproches no son ninguna excepción). Aquí te hemos ofrecido una síntesis de un proceso que hemos desarrollado y que nos funciona, pero podrás leer todos los pormenores al respecto en nuestro manual de gestión de incidentes.
Consigue el manual en PDF
Tenemos un suministro limitado de versiones impresas de nuestro Manual de gestión de incidentes, que enviamos de forma gratuita. También puedes descargar una versión en PDF.
Descubre la comunicación de incidentes con Statuspage
En este tutorial, te mostraremos cómo utilizar plantillas de incidentes para comunicarte eficazmente durante las interrupciones. Puedes aplicarlo a muchos tipos de interrupciones del servicio.
Leer el tutorialLa importancia de un proceso de análisis retrospectivo de los incidentes
El análisis retrospectivo de un incidente, también conocido como "revisión posincidente", es la mejor manera de repasar lo sucedido durante un incidente y plasmar las lecciones aprendidas.
Leer el artículo