Incidentmanagement voor razendsnelle teams
Betrouwbaarheid versus beschikbaarheid: de verschillen begrijpen
Klanten van vandaag verwachten steeds vaker dat bedrijven altijd service leveren. Maar zelfs goed voorziene bedrijven kunnen te maken krijgen met storingen en onderbrekingen. Twee verschillende statistieken, betrouwbaarheid en beschikbaarheid, kunnen helpen om succes te meten en verbeteringen aan te brengen.
Betrouwbaarheid, of de gereedheid van het systeem, meet de prestaties met specifieke tussenpozen aan de hand van gedefinieerde prestatienormen. Beschikbaarheid, of systeemfunctie, meet het operabiliteitspercentage. Samen bieden ze inzicht in de gezondheid van bedrijfssystemen en identificeren ze gebieden die beter zouden kunnen presteren.
Deze handleiding bespreekt de betrouwbaarheid versus beschikbaarheid van een service, hoe statistieken voor incidentmanagement ze helpen meten en hoe deze belangrijke statistieken verbeterd kunnen worden.
Wat is systeembetrouwbaarheid?
Betrouwbaarheid is de kans dat een systeem of component gedurende een bepaalde periode consequent zijn beoogde functie vervult zonder dat het uitvalt. Teams moeten begrijpen hoe ze de betrouwbaarheid kunnen meten en waarborgen om weloverwogen beslissingen te nemen over de prestaties van het systeem en om de klanttevredenheid te verbeteren.
Salarissystemen moeten bijvoorbeeld directe stortingen op betrouwbare wijze verwerken binnen een bepaald tijdsbestek per maand, terwijl systemen voor koelopslag stroomuitval moeten detecteren en zonder fouten moeten overschakelen op noodgeneratoren. In alle sectoren is het cruciaal om de betrouwbaarheid van geautomatiseerde processen te handhaven en de prestaties te volgen aan de hand van KPI's voor incidentmanagement, aangezien storingen aanzienlijke financiële gevolgen kunnen hebben.
Definitie van betrouwbaarheid
Betrouwbaarheid is de kans dat een systeem of component de beoogde functie zonder fouten zal uitvoeren onder bepaalde omstandigheden gedurende een bepaalde periode. Het meet het vermogen van een systeem of component om ondanks fouten of storingen de functionaliteit en prestaties te behouden.
Betrouwbaarheid is van cruciaal belang voor het ontwerp en onderhoud van systemen, omdat dit rechtstreeks van invloed is op de algemene prestaties, veiligheid en kosteneffectiviteit van een systeem. Hoge betrouwbaarheid betekent dat het systeem of de component correct en consistent zal werken, wat essentieel is om het vertrouwen van de klant en de operationele efficiëntie te behouden.
Hoe je storingspercentages meet en berekent voor betrouwbaarheid
Je kunt de betrouwbaarheid meten met standaard statistieken voor incidentmanagement, zoals:
- Gemiddelde tijd tussen storingen (MTBF, Mean Time Between Failures): bereken MTBF door de totale uitvoeringstijd te delen door het aantal storingen. Deze statistiek is cruciaal om inzicht te krijgen in de gemiddelde tijdsduur tussen storingen.
-
Storingspercentage: bereken de storingspercentages door het aantal storingen te delen door de totale serviceduur. Handboeken zoals MIL-HNDBK-217 kunnen leiden tot onnauwkeurigheden als gevolg van de aanname van een constant storingspercentage, wat kan resulteren in misleidende voorspellingen over de betrouwbaarheid van componenten, vooral als componenten ouder worden.
Het is belangrijk om rekening te houden met bijkomende factoren, zoals SLA's (service level agreements) en wat klanten van het systeem verwachten. Betrouwbaarheidsnormen kunnen variëren, afhankelijk van wat er gevaar loopt als een systeem uitvalt. Zorgt een storing er bijvoorbeeld voor dat een groep belastingadviseurs een middagje vrij neemt? Of heeft deze als gevolg dat er duizenden vliegtuigpassagiers ver van huis zijn gestrand?
Berekeningen voor de betrouwbaarheid
Betrouwbaarheidsberekeningen maken gebruik van wiskundige modellen en statistische technieken om de betrouwbaarheid van een systeem of component in te schatten. Meestal maken ze gebruik van storingspercentages, de gemiddelde tijd tussen storingen (MTBF) en andere betrouwbaarheidsstatistieken om de kans op uitval van systemen of componenten te bepalen.
Door deze statistieken te analyseren, kunnen bedrijven potentiële zwakke punten en verbeterpunten identificeren. Betrouwbaarheidsberekeningen kunnen worden uitgevoerd met behulp van verschillende methoden, waaronder foutenboomanalyse, betrouwbaarheidsblokdiagrammen en Markov-modellering. Deze technieken helpen bij het visualiseren en kwantificeren van de betrouwbaarheid van complexe systemen, zodat besluitvormers weloverwogen keuzes kunnen maken over ontwerp, onderhoud en toewijzing van middelen.
Gemiddelde tijd tot storingen (MTTF, Mean Time to Failure) en Gemiddelde tijd tussen storingen (MTBF, Mean Time Between Failures)
Gemiddelde tijd tot storingen (MTTF) is de gemiddelde tijd tot een systeem of onderdeel uitvalt, terwijl Gemiddelde tijd tussen storingen (MTBF) de gemiddelde tijd tussen storingen is. MTTF wordt doorgaans gebruikt voor niet-repareerbare systemen, terwijl MTBF wordt gebruikt voor repareerbare systemen. Beide statistieken zijn belangrijk voor betrouwbaarheidsberekeningen, omdat ze inzicht geven in de frequentie en waarschijnlijkheid van storingen in systemen of componenten.
Door deze statistieken te begrijpen, kunnen bedrijven de onderhoudsbehoeften beter voorspellen, vervangingen plannen en de algehele betrouwbaarheid van het systeem verbeteren. De berekening van MTTF en MTBF omvat het verzamelen van gegevens over storingen en het gebruik van statistische methoden om respectievelijk de gemiddelde tijd tot een storing en tussen storingen te berekenen.
De betrouwbaarheid verbeteren
Er zijn een paar stappen die bedrijven kunnen nemen om de betrouwbaarheid van hun services te verbeteren:
- Stel routinematige onderhoudsschema's op om systemen up-to-date en gemoderniseerd te houden.
- Implementeer systeemredundantie om te voorkomen dat storingen in componenten processen stil leggen.
- Voer kwaliteitscontroles en tests uit wanneer je systemen bijwerkt of veranderingen aanbrengt, zodat teams problemen kunnen oplossen voordat ze de productie bereiken.
- Gebruik uitgebreide methoden voor gegevensverzameling en -analyse op grote schaal om inzicht te krijgen in de betrouwbaarheid en prestaties van het systeem.
Verbeter incidentencommunicatie om respons- en hersteltijd te verminderen.
Wat is beschikbaarheid?
Beschikbaarheid is het percentage van de tijd dat een systeem of component operationeel is en zijn functie kan uitvoeren: de uptime.
Grote online retailers moeten bijvoorbeeld 24 uur per dag en 7 dagen per week beschikbaar zijn om aan de vraag van klanten te voldoen. Anders lopen ze het risico marktaandeel te verliezen aan concurrenten. De beschikbaarheid houdt rekening met verschillende omstandigheden, zoals internetsnelheden van gebruikers en piekverkeer.
Definitie van beschikbaarheid
Beschikbaarheid is de kans dat een systeem of component op een bepaald moment operationeel en beschikbaar is. Het is een maatstaf voor het vermogen van een systeem of component om de beoogde functie uit te voeren wanneer dat nodig is.
De beschikbaarheid wordt vaak berekend aan de hand van de formule: Beschikbaarheid = (MTBF / (MTBF + MTTR)), waarbij MTTR de gemiddelde reparatietijd is. Deze formule legt duidelijk uit hoe vaak een systeem naar verwachting operationeel en klaar voor gebruik zal zijn. Hoge beschikbaarheid is cruciaal voor systemen die continu moeten worden gebruikt, zoals online services en kritieke infrastructuur. Door zich te concentreren op MTBF en MTTR kunnen bedrijven de beschikbaarheid van hun systemen verbeteren en aan de verwachtingen van de gebruikers voldoen.
De beschikbaarheid meten
De meting van de beschikbaarheid bestaat slechts uit één percentage. Het is de totale verstreken tijd min de totale downtime gedeeld door de totale verstreken tijd:
beschikbaarheidspercentage = (totale verstreken tijd – downtime) / totale verstreken tijd
Als een online winkel bijvoorbeeld drie uur per dag niet beschikbaar is vanwege overbelasting, is de beschikbaarheidsscore 87,5%. Voor grote internationale retailers ligt het standaardpercentage dichter bij de 99,5%. Dit betekent dat de online retailer nog veel te verbeteren heeft.
Met ITSM-software zoals Jira Service Management kunnen teams incidenten volgen en gegevens verzamelen om de beschikbaarheid te meten.
De beschikbaarheid verbeteren
Er zijn verschillende manieren waarop bedrijven de beschikbaarheid kunnen verbeteren:
- Implementeer proactieve, standaard onderhoudsschema's om een hoge beschikbaarheid te garanderen.
- Implementeer systeemredundantie met failover-mechanismen.
-
Zet snelle herstelprocessen op als onderdeel van incidentmanagement.
Met name proactief onderhoud kan bedrijven helpen om de beschikbaarheid en betrouwbaarheid van services te verbeteren. Het uitvoeren van een onderzoek naar betrouwbaarheid, beschikbaarheid en onderhoudbaarheid (RAM; reliability, availability, maintainability) kan belangrijke inzichten opleveren over waar de onderhoudsinspanningen op moeten worden gericht.
Betrouwbaarheid versus beschikbaarheid
Betrouwbaarheid en beschikbaarheid worden vaak met elkaar verward. Maar niet alleen zijn ze verschillend, ze komen ook niet altijd overeen.
Zelfs de normen waarmee bedrijven ze meten, kunnen verschillen, afhankelijk van het systeem en de functie ervan. Om een nauwkeurig beeld te krijgen van een bedrijfssysteem, moet je de betrouwbaarheids- en beschikbaarheidsstatistieken afzonderlijk analyseren.
- De betrouwbaarheid meet of het systeem de juiste output heeft geleverd op een specifiek, gedefinieerd tijdstip, bijvoorbeeld of de salarissen op de juiste dag naar de juiste accounts zijn overgeboekt.
- De beschikbaarheid meet de uptime van het systeem, bijvoorbeeld of te vroeg geboren baby's gedurende de noodzakelijke incubatieperiode ononderbroken worden voorzien van zuurstofmonitoring.
Jira Service Management bevat automatiseringssjablonen waarmee gegevens kunnen worden verzameld, de incidentencommunicatie kan worden verhoogd en de algehele klantenservice kan worden verbeterd.
Verschillen
Betrouwbaarheids- en beschikbaarheidsstatistieken en hun verschillen worden duidelijker wanneer je kijkt naar hoe ze gebruikt kunnen worden om de prestatie te verbeteren. Betrouwbaarheid is bedoeld om systeemstoringen en downtime tot een minimum te beperken, terwijl beschikbaarheid is gericht op het maximaliseren van de operationele tijd.
Om de betrouwbaarheid van een zelfscansysteem in een supermarkt te meten, moet je mogelijk analyseren hoe vaak klanten assistentie nodig hebben om een transactie te voltooien. Voor het meten van de beschikbaarheid kun je controleren of klanten überhaupt de zelfscankassa proberen te gebruiken.
Overeenkomsten
Betrouwbaarheid en beschikbaarheid vullen elkaar aan. Concurrerende bedrijven streven ernaar beide statistieken te verbeteren voor de beste resultaten. Systemen met een hoge beschikbaarheid die vaak betrouwbaarheidsproblemen ondervinden, voldoen bijvoorbeeld waarschijnlijk niet aan de behoeften van de klant, hoe snel je de problemen ook kunt oplossen.
Voor het verbeteren van beide statistieken heb je vaak vergelijkbare benaderingen nodig. Voorbeelden van maatregelen zijn: het routinematig uitvoeren van onderhoudswerkzaamheden, het implementeren van redundantie, het opstellen van noodplannen en testen.
Factoren die van invloed zijn op betrouwbaarheid en beschikbaarheid
Verschillende factoren kunnen van invloed zijn op de betrouwbaarheid en beschikbaarheid van het systeem:
- Omgeving: dit kunnen IoT-componenten zijn, zoals manometers die worden blootgesteld aan guur weer, of cyclische gebruikerspatronen, zoals veel verkeer op je online winkel op bepaalde dagen. Het gemiddelde en de standaardafwijking worden toegepast op verschillende parameters om de kans op storing te beoordelen en de methoden voor veiligheidsfactoren te verbeteren.
- Componentkwaliteit: voorbeelden hiervan zijn externe integraties of hardware. Het belang van standaardafwijking voor het begrijpen van de variabiliteit van berekeningsresultaten en de kans op storing in structurele analyses kan niet genoeg benadrukt worden.
Operationeel: dit kan bijvoorbeeld de frequentie van inspecties en onderhoudswerkzaamheden omvatten of investeringen in gemoderniseerde software.
Bedrijven kunnen de algehele betrouwbaarheid en beschikbaarheid van services verbeteren door de drempelwaarde van omgevingen te standaardiseren en redundantie te implementeren, door ISO-naleving te eisen voor de componentkwaliteit, of door procedures te implementeren om elk aspect van het systeem te inspecteren, te testen en te onderhouden.
Betrouwbaarheid en beschikbaarheid in evenwicht brengen met Jira Service Management
Met de juiste tools en aanpak kunnen bedrijven een evenwicht vinden tussen de betrouwbaarheid en beschikbaarheid van systemen, vooral in onze wereld waarin alles altijd beschikbaar is. Jira Service Management stelt teams in staat om de service snel te herstellen.
Jira en Jira Service Management stellen klanten in staat problemen te melden en serviceteams te helpen bij het centraliseren van meldingen voor snelle categorisering en prioritering. Dankzij regels en communicatiekanalen ziet niemand ooit een cruciaal probleem over het hoofd.
Meer informatie over incidentmanagement in Jira Service Management
Betrouwbaarheid versus beschikbaarheid: veelgestelde vragen
Wat is een voorbeeld van betrouwbaarheid versus beschikbaarheid?
Denk aan nieuwe technologie, zoals zelfrijdende auto's. De betrouwbaarheidsnormen van de service zijn bijna 100%, omdat een enkele storing letsel of zelfs de dood tot gevolg kan hebben.
Omgekeerd heeft de beschikbaarheid van zelfrijdende auto's invloed op de gebruikerservaring. Hoe hoger de beschikbaarheid of de operationele tijd, hoe beter de ervaring. Een lage beschikbaarheid kan ertoe leiden dat het bedrijf marktaandeel verliest, maar het is onwaarschijnlijk dat dit leidt tot letsel of de dood.
Waarom zijn betrouwbaarheid en beschikbaarheid belangrijk?
Zowel betrouwbaarheid als beschikbaarheid hebben invloed op de bedrijfsresultaten omdat ze de klanttevredenheid beïnvloeden. Bovendien kosten systemen die niet beschikbaar of niet betrouwbaar zijn bedrijven geld in de vorm van inkomstenverlies, derving, ongeplande onderhoudskosten en productiviteitsverlies.
Door je te richten op het verbeteren van de betrouwbaarheid en beschikbaarheid van services, kun je mogelijk profiteren van groter concurrentievoordeel, een groter marktaandeel, betere inkomsten en een verbeterd budgetplan voor onderhoudskosten.
Wat zijn de compromissen tussen betrouwbaarheid en beschikbaarheid?
Bedrijven moeten soms prioriteit geven aan betrouwbaarheid boven beschikbaarheid, of omgekeerd. Mogelijk moet je echt compromissen sluiten wanneer je weinig tijd hebt of beperkte investeringsmiddelen hebt.
In het geval van zelfrijdende auto's investeren bedrijven waarschijnlijk meer tijd en moeite in een grotere betrouwbaarheid, zelfs als dat een negatieve invloed heeft op de beschikbaarheid. In minder kritieke situaties, zoals online detailhandel, kan een bedrijf zich echter richten op het vergroten van de beschikbaarheid, omdat 'altijd open' zijn een van de belangrijkste onderscheidende factoren is tussen e-commerce en fysieke detailhandel.
Waarom betrouwbaarheidsberekeningen belangrijk zijn voor het ontwerp van systemen
Betrouwbaarheidsberekeningen zijn cruciaal voor het ontwerp en onderhoud van systemen. Door de concepten betrouwbaarheid, beschikbaarheid en storingspercentages te begrijpen, kunnen besluitvormers weloverwogen beslissingen nemen over het ontwerp, het onderhoud en de reparatie van systemen.
Betrouwbaarheidsberekeningen kunnen helpen de downtime tot een minimum te beperken, de onderhoudskosten te verlagen en de algehele prestaties van het systeem te verbeteren. Door robuuste betrouwbaarheids- en beschikbaarheidsstrategieën te implementeren, kunnen bedrijven hun operationele efficiëntie verbeteren, de klanttevredenheid behouden en een concurrentievoordeel behalen in hun branche.
Belangrijke punten opnieuw bekeken
- Betrouwbaarheid is de kans dat een systeem of component de beoogde functie zonder fouten zal uitvoeren onder bepaalde omstandigheden gedurende een bepaalde periode.
- Betrouwbaarheidsberekeningen maken gebruik van wiskundige modellen en statistische technieken om de betrouwbaarheid van een systeem of component in te schatten.
- Gemiddelde tijd tot storingen (MTTF) en Gemiddelde tijd tussen storingen (MTBF) zijn belangrijke statistieken voor betrouwbaarheidsberekeningen.
- Beschikbaarheid is de kans dat een systeem of component op een bepaald moment operationeel en beschikbaar is.
Betrouwbaarheidsberekeningen kunnen helpen de downtime tot een minimum te beperken, de onderhoudskosten te verlagen en de algehele prestaties van het systeem te verbeteren.
Door zich op deze belangrijke aspecten te concentreren, kunnen bedrijven ervoor zorgen dat hun systemen betrouwbaar en beschikbaar zijn en in staat zijn om te voldoen aan de eisen van hun klanten en activiteiten.
Ontdek incidentcommunicatie met Statuspage
In deze tutorial laten we je zien hoe je incidentsjablonen kunt gebruiken om effectief te communiceren tijdens storingen. Aanpasbaar voor de vele soorten serviceonderbrekingen.
Lees deze tutorialHet belang van een postmortemproces bij incidenten
Een postmortemincident, ook wel bekend als een beoordeling na een incident, is de beste manier om door te werken wat er tijdens een incident is gebeurd en geleerde lessen vast te leggen.
Lees dit artikel