Incidentmanagement voor razendsnelle teams
De kosten van downtime berekenen
Inzicht in de financiële gevolgen van ernstige incidenten
In maart 2015 kostte een uitval van 12 uur bij de Apple Store het bedrijf $ 25 miljoen.
In augustus 2016 veroorzaakte een stroomstoring van vijf uur in een Operation Center van Delta Airlines 2.000 geannuleerde vluchten en zo'n $ 150 miljoen aan kosten.
In maart 2019 kostte een uitval van 14 uur Facebook naar schatting 90 miljoen dollar.
En dan hebben we het over de grote jongens. De marktleiders. De bedrijven met vette operationele marges en miljoenen op de bank. Zij kunnen een financiële rampdag wel aan. Het feit is dat hoewel kleinere bedrijven schades van kleinere omvang leiden wegens ernstig incidenten, deze lagere cijfers toch een groter effect kunnen hebben op hun bedrijfsresultaten.
Uit onderzoek onder 101 start-ups bleek zelfs dat 29% van de bedrijven niet slagen, failliet gaan door een gebrek aan geld. Als start-ups al risico lopen, is het bijna ondenkbaar dat de meeste nog een ernstig incident aan zouden kunnen zonder kopje onder te gaan.
De moraal van het verhaal: downtime is een groot probleem. Iedereen die iets anders zegt, heeft niet goed opgelet. Incidenten kunnen niet alleen schadelijk zijn voor het vertrouwen en de loyaliteit van klanten. Ze zijn voor velen ook de financiële Magere Hein.
De gemiddelde kosten van downtime
Volgens een onderzoek van Gartner uit 2014 waren de gemiddelde kosten van een minuut downtime $ 5.600. Het onderzoeksbureau wijst er echter op dat dit slechts een gemiddelde is. Uit een rapport van Avaya uit hetzelfde jaar bleek dat de gemiddelden varieerden van $ 2.300 tot $ 9.000 per minuut, afhankelijk van factoren zoals de grootte van het bedrijf en de sector. En dat gemiddelde is sinds 2014 alleen maar gestegen. Een recenter onderzoeksrapport (van het Ponemon Institute in 2016) gaf in vergelijking met het gemiddelde van Gartner van $ 5.600 per minuut een veel hoger bedrag, van bijna $ 9.000 per minuut.
Voor kleinere bedrijven ligt dit cijfer lager, maar blijft het significant: $ 137 tot $ 427 per minuut. Waar jouw bedrijf binnen dit brede spectrum valt, is afhankelijk van verschillende factoren, waaronder de sector, de omvang van je bedrijf en het bedrijfsmodel.
Sector
De sectoren waarin bedrijven het meeste risico lopen, zijn het bankwezen en financiën, de overheid, de gezondheidszorg, productie, media en communicatie, de detailhandel en transport-/nutsbedrijven. Uit een onderzoek uit 2016 bleek dat de gemiddelde kosten voor downtime in deze sectoren meer dan $ 5 miljoen per uur bedroegen.
Omvang van de organisatie
De grootte van de organisatie is ook een belangrijke factor. Voor bedrijven uit de Fortune 1000 zou downtime volgens een onderzoek van IDC maar liefst $ 1 miljoen per uur kunnen kosten. En hoewel een doorsnee middelgrote onderneming 1 miljoen dollar per jaar uitgeeft aan incidenten, kunnen grote ondernemingen volgens een onderzoeksrapport van IHS tot wel 60 miljoen dollar of meer uitgeven.
Bedrijfsmodel
Tot slot spelen bedrijfsmodellen ook een grote rol in de kostenberekeningen van downtime. Een e-commercesite zonder fysieke verkooplocaties heeft duidelijk meer te verliezen bij een internetstoring dan een bedrijf met fysieke verkooplocaties. Hoe meer je bedrijfsmodel afhankelijk is van uptime, hoe meer je (logischerwijs) te verliezen hebt bij downtime.
Voor e-commercegigant Amazon, wiens volledige bedrijfsmodel afhankelijk is van uptime, worden de kosten geschat op ongeveer $ 13,22 miljoen per uur. Bij Facebook, waarvan de inkomsten afhankelijk zijn van advertenties, lopen de cijfers waarschijnlijk ook ver in de miljoenen.
Snelle downtime berekening
Gebruik de volgende formule, gebaseerd op de omvang van je bedrijf en het aantal minuten dat je meest recente incident duurde, om een snelle schatting te krijgen van de kosten van mogelijke downtime in je bedrijf:
Kosten van downtime = minuten downtime x kosten per minuut.
Gebruik voor kleine bedrijven $ 427 als kosten per minuut. Gebruik voor middelgroot en groot $ 9.000.
Inzicht in de volledige kosten van downtime
Als de gemiddelde persoon nadenkt over de kosten van downtime, is hij waarschijnlijk gefocust op gederfde inkomsten. Of misschien een combinatie van inkomsten en productiviteit van werknemers. Maar kern van de waarheid is dat de kosten van downtime veel verder reiken.
Volgens Ponemon, een onafhankelijk onderzoeksbureau voor gegevensbescherming en beveiliging, bestaat het grootste deel van de kosten voor downtime uit bedrijfsonderbrekingen, een categorie die reputatieschade en klantverloop omvat. Inkomstenverlies stond op de tweede plaats in het onderzoek van het bedrijf. En de derde grootste financiële pijn in verband met incidenten was de productiviteit van eindgebruikers.
Een andere veelvoorkomende categorie van schade is gederfde interne productiviteit van het IT-team dat je incident moet oplossen, of van een ander team dat betrokken is bij incidentmanagement (zoals PR, socialmediamanagers en klantservicemedewerkers) en van andere werknemers die door de uitval getroffen zijn.
Voor softwareleveranciers zijn SLA's, financiële sancties, overheidsboetes (voor elke overtreding van wettelijke vereisten) en rechtzaken en schikkingen zeer reële financiële lasten. En voor bedrijven die in fysieke producten handelen, vormt een lege voorraad een aanzienlijk risico.
Om nog maar te zwijgen over de kosten van aannemers, vervanging van apparatuur en problemen met het behoud van werknemers. Incidenten veroorzaken immers stress. Stress zorgt voor ongelukkige werknemers. En ongelukkige werknemers vertrekken. Deskundigen schatten de kosten voor het vervangen van een werknemer op 33% van hun jaarsalaris.
De kosten van downtime minimaliseren
Uit cijfers zoals hierboven blijkt duidelijk dat het minimaliseren van downtime een prioriteit zou moeten zijn voor bedrijven van elke omvang en in alle sectoren. Dus, hoe kunnen we het risico op downtime verlagen en de kosten tot een minimum beperken? Hier zijn vijf beproefde manieren:
Een gedetailleerd disasterrecoveryplan opstellen
Wat doe je als de downtime toeslaat? Als je het antwoord op die vraag nog niet weet, is het standaardantwoord meestal 'kostbare tijd verspillen met uitzoeken wat je moet doen'.
Hoe beter je plan voor incidentrespons is, hoe sneller en effectiever je teams incidenten kunnen afhandelen. Daarom moet de eerste stap van elk nieuw programma voor incidentmanagement verwerking en planning zijn.
Duidelijk en vaak communiceren
Aangezien bedrijfsverstoringen maar liefst 35% van de kosten voor downtime uitmaken, is het belangrijker dan ooit om prioriteit te geven aan incidentcommunicatie en klantenservice tijdens en na incidenten.
Enkelvoudige foutpunten elimineren
Een van de snelste manieren om downtime te verminderen en de bijbehorende kosten te verlagen, is om enkelvoudige foutpunten uit je bestaande infrastructuur en processen te verwijderen. Dit betekent dat je bijvoorbeeld de werklast tussen servers moet verdelen, goede werkwijzen moet hebben voor back-ups en collegiale toetsing en technische failsafes moet inbouwen in je implementaties.
Preventie prioriteren
Incidenten zijn nooit voor 100% te vermijden. Maar dat betekent niet dat je de schade niet kunt minimaliseren.
In feite zijn de hoge kosten van downtime een goede motivator voor managers om prioriteit te geven aan verouderde systemen en beveiligingsfuncties vervangen en problemen oplossen voordat ze in volledige incidenten uitmonden.
De postmortem niet overslaan
Als de downtime toeslaat (en in onze complexe, technische wereld gebeurt dat uiteindelijk altijd), is een sterke postmortemwerkwijze de beste manier om toekomstige storingen te voorkomen.
Een incidentpostmortem brengt teams samen om de details van een incident na te bespreken: waarom het is gebeurt, de impact ervan, welke acties er zijn ondernomen om schade te beperken en het probleem op te lossen en, allerbelangrijkst, wat er moet gebeuren om herhaling te voorkomen.
Bij Atlassian zijn onze postmortems zonder schuldvraag erop gericht om tot de kern van het probleem te komen in plaats van iemand de schuld te geven. We zijn ook voorstanders van slimme documentatie, die is ontworpen om samen te vatten wat we tijdens onze postmortem hebben geleerd en om verbeteringen voor te stellen die ons zullen helpen voorkomen dat we het probleem dat we zojuist hebben opgelost, steeds opnieuw moeten oplossen.
Jira Service Management is ontwikkeld om teams te helpen incidenten snel op te lossen, zodat ze de kosten van downtime tot een minimum kunnen beperken.
Ontdek incidentcommunicatie met Statuspage
In deze tutorial laten we je zien hoe je incidentsjablonen kunt gebruiken om effectief te communiceren tijdens storingen. Aanpasbaar voor de vele soorten serviceonderbrekingen.
Lees deze tutorialHet belang van een postmortemproces bij incidenten
Een postmortemincident, ook wel bekend als een beoordeling na een incident, is de beste manier om door te werken wat er tijdens een incident is gebeurd en geleerde lessen vast te leggen.
Lees dit artikel