Gestión de incidentes para equipos de alta velocidad
Cálculo del coste del tiempo de inactividad
Comprensión del impacto financiero de los incidentes graves
En marzo de 2015, una interrupción de 12 horas en la tienda de Apple le costó a la empresa 25 millones de dólares.
En agosto de 2016, un corte eléctrico en un centro de operaciones provocó la cancelación de 2000 vuelos y una pérdida estimada de 150 millones de dólares para Delta Airlines.
En marzo de 2019, una interrupción de 14 horas le costó a Facebook unos 90 millones de dólares.
Y estos son los peces gordos, los líderes de sus sectores, que trabajan con márgenes operativos y millones en el banco. Ellos pueden sobrellevar una tormenta financiera de un día. En cambio, aunque las empresas más pequeñas pueden sufrir pérdidas menores durante un incidente grave, esas cifras menores pueden tener mucha mayor repercusión en sus resultados.
De hecho, según un estudio de 101 startups, el 29 % de las que fracasan lo hacen porque se quedan sin efectivo. Si las startups ya están en riesgo, es difícil imaginar que la mayoría de ellas pudiera superar un incidente grave sin colapsarse.
La moraleja de la historia es que el tiempo de inactividad es muy importante. Quien diga lo contrario es porque no ha prestado atención. Los incidentes no solo son potencialmente tóxicos para la confianza y la lealtad del cliente, sino que además son la parca en términos financieros.
El coste medio del tiempo de inactividad
El coste medio del tiempo de inactividad es de 5600 dólares por minuto, según un estudio de 2014 realizado por Gartner. Sin embargo, la empresa de investigación se apresura en señalar que esto es solo una media. Un informe de Avaya el mismo año concluyó que las medias oscilaban entre los 2300 y los 9000 dólares por minuto, dependiendo de factores como el tamaño de la empresa y del segmento de mercado vertical. Y desde 2014, esa cifra ha ido en aumento. Un informe más reciente (del Ponemon Institute en 2016) eleva la media de Gartner de 5600 dólares por minuto a casi 9000 dólares por minuto.
Para las pequeñas empresas, esa cifra se reduce a la mínima expresión, aunque todavía significativa, de 137 a 427 dólares por minuto. El lugar que ocupa tu empresa en este amplio espectro depende de varios factores, como el segmento de mercado vertical, el tamaño de la organización y el modelo de negocio.
Segmento de mercado vertical
Los sectores con mayor riesgo son el bancario/financiero, el gubernamental, el sanitario, el manufacturero, el de publicidad y medios de comunicación, el minorista y el de transporte/servicios públicos. Un estudio de 2016 determinó que el coste medio del tiempo de inactividad en estos sectores ascendía a más de 5 millones de dólares por hora.
Tamaño de la organización
El tamaño de la organización también es un factor clave. Para las empresas de la lista Fortune 1000, el tiempo de inactividad puede costar hasta 1 millón de dólares por hora, según una encuesta realizada por IDC. Y mientras la típica empresa mediana gasta 1 millón de dólares al año en incidentes, las grandes empresas pueden llegar a gastar hasta 60 millones de dólares o más, según un informe de investigación del IHS.
Modelo de negocio
Por último, los modelos de negocio también influyen en los cálculos de los costes del tiempo de inactividad. Sobra decir que un sitio de comercio electrónico sin puntos de venta físicos tiene más que perder por una interrupción del servicio de la web que un negocio que sí dispone de lugares de venta físicos. Lógicamente, cuanto más dependa tu modelo de negocio del tiempo de actividad, más tendrás que perder por el tiempo de inactividad.
En el caso del gigante del comercio electrónico Amazon, cuyo modelo de negocio se basa en el tiempo de actividad, se estima que los costes son de unos 13,22 millones de dólares por hora. Los ingresos de Facebook dependen de las impresiones publicitarias, así que también se enfrenta a cifras millonarias.
Calculadora rápida del tiempo de inactividad
Para obtener un cálculo rápido de los posibles costes del tiempo de inactividad de tu empresa, utiliza la siguiente fórmula, basada en el tamaño de tu empresa y el número de minutos que duró el último incidente registrado:
Coste del tiempo de inactividad = minutos del tiempo de inactividad × coste por minuto.
Para pequeñas empresas, utiliza 427 $ como coste por minuto. Para medianas y grandes empresas, utiliza 9000 $.
Comprensión del coste total del tiempo de inactividad
Cuando una persona común piensa en los costes del tiempo de inactividad, probablemente se centra en la pérdida de ingresos o quizá en una combinación de ingresos y productividad de los empleados. Pero la verdad es que los costes del tiempo de inactividad tienen mayor calado.
Según Ponemon, una empresa independiente de investigación en protección de datos y seguridad, la mayor proporción del coste del tiempo de inactividad se atribuye a la interrupción del negocio, una categoría que incluye daños a la reputación y rotación de clientes. La pérdida de ingresos ocupó el segundo lugar en la investigación de la empresa. Y el tercer mayor problema financiero asociado a los incidentes fue la productividad del usuario final.
Otra categoría común de pérdidas es la pérdida de productividad interna: del equipo de TI encargado de resolver el incidente, de los equipos adyacentes que participan en la gestión de incidentes (como los de relaciones públicas, los gestores de redes sociales y los representantes de atención al cliente) y de otros empleados afectados por la interrupción.
Para los proveedores de software, las penalizaciones financieras del SLA, las multas gubernamentales (por cualquier incumplimiento de los requisitos reglamentarios), los litigios y los arreglos son una fuente importante de pérdida económica. En el caso de las empresas que negocian con productos físicos, el inventario agotado es un riesgo significativo.
Eso sin mencionar los costes de los contratistas, la sustitución de equipos y los problemas de retención de empleados. Después de todo, los incidentes provocan estrés; el estrés crea trabajadores descontentos, y los trabajadores descontentos cambian de trabajo. Los expertos estiman que el coste de sustituir a un empleado es del 33 % de su salario anual.
Cómo minimizar los costes del tiempo de inactividad
Cifras como las anteriores dejan claro que minimizar el tiempo de inactividad debe ser una prioridad para las empresas de cualquier tamaño y en todos los sectores. Entonces, ¿cómo podemos mitigar los riesgos del tiempo de inactividad y minimizar los costes? A continuación, indicamos cinco métodos de eficacia probada:
Crea un plan detallado de recuperación ante desastres
¿Qué harás en caso de que se produzca tiempo de inactividad? Si aún no tienes respuesta a esa pregunta, lo habitual será que pierdas un valioso tiempo para determinar qué hacer.
Cuanto mejor sea tu plan de respuesta ante incidentes, más rápida y eficaz será la gestión de los incidentes por parte de los equipos. Por eso, el primer paso de cualquier nuevo programa de gestión de incidentes debería ser el proceso y la planificación.
Comunicarse con claridad y de forma periódica
Teniendo en cuenta que la interrupción del negocio representa la friolera del 35 % de los costes del tiempo de inactividad, es más importante que nunca dar prioridad a la comunicación de incidentes y a la atención al cliente durante un incidente y después de que este ocurra.
Eliminar puntos únicos de fallo
La eliminación de puntos únicos de fallo de tu infraestructura y procesos existentes es una de las formas más rápidas de reducir el tiempo de inactividad y de mitigar sus costes. Esto significa hacer cosas como equilibrar la carga entre los servidores, seguir las prácticas recomendadas de copia de seguridad e incorporar revisiones por pares y las garantías de seguridad técnica en tus implementaciones.
Dar prioridad a la prevención
No hay una manera 100 % infalible de evitar incidentes, pero esto no significa que no se puedan reducir.
De hecho, el elevado coste del tiempo de inactividad es un buen aliciente para que la dirección dé prioridad a la sustitución de sistemas y funciones de seguridad obsoletos y a la corrección de incidencias antes de que se conviertan en incidentes en toda regla.
No saltarse los análisis retrospectivos
Cuando el tiempo de inactividad se produce (y en nuestro complejo mundo técnico, siempre lo hace), la mejor manera de evitar interrupciones en el futuro es contar con una práctica de análisis retrospectivo sólida.
El análisis retrospectivo de un incidente reúne a los equipos para comentar los pormenores de un incidente: el motivo por el que se produjo, sus consecuencias, las medidas que se tomaron para mitigarlo y resolverlo, y, sobre todo, qué habría que hacer para impedir que vuelva a suceder.
En Atlassian, nuestros análisis retrospectivos son sin reproches, es decir, se centran en llegar al origen de la incidencia en lugar de culpabilizar a nadie. También defendemos la documentación inteligente, diseñada para resumir lo que hemos aprendido durante nuestro análisis retrospectivo, y sugerimos mejoras que nos ayudarán a evitar que la incidencia que acabamos de corregir se repita.
Jira Service Management se ha desarrollado para que los equipos puedan solucionar los incidentes rápidamente y minimizar el coste del tiempo de inactividad.
Descubre la comunicación de incidentes con Statuspage
En este tutorial, te mostraremos cómo utilizar plantillas de incidentes para comunicarte eficazmente durante las interrupciones. Puedes aplicarlo a muchos tipos de interrupciones del servicio.
Leer el tutorialLa importancia de un proceso de análisis retrospectivo de los incidentes
El análisis retrospectivo de un incidente, también conocido como "revisión posincidente", es la mejor manera de repasar lo sucedido durante un incidente y plasmar las lecciones aprendidas.
Leer el artículo