Gestione degli imprevisti per i team high velocity
Comprensione dei livelli di gravità degli imprevisti
Identifica gli imprevisti e definiscine le priorità per una risoluzione più rapida
Ci sono tre verità fondamentali sulla gestione degli imprevisti.
La prima è che gli imprevisti sono inevitabili, soprattutto per le aziende che crescono e innovano costantemente.
La seconda è che una solida pratica di gestione degli imprevisti è fondamentale per un'azienda sana (e una debole ha un costo per le aziende sia in termini di tempo e soddisfazione dei dipendenti che di ricavi aziendali).
La terza è che non tutti gli imprevisti sono uguali. Perdere dati da un database non è la stessa cosa che perdere dati da tutti i database. Gestire un'interruzione che ha un impatto sul 20% degli utenti è un obiettivo completamente diverso rispetto a un'interruzione che ha un impatto sul 90% o sul 100%. Gestire un'interruzione del sistema nelle ore di punta è molto più stressante che gestirne una quando la maggior parte dei clienti dorme. Anche due imprevisti che sulla carta sembrano identici, a un esame più approfondito sono unici.
Gestione degli imprevisti per i team high velocity
Accelera il flusso di informazioni tra i team operativi e di sviluppo per fornire una risposta adeguata ed eseguire il ripristino dei sistemi in caso di imprevisti con Jira Service Management.
Ecco perché le aziende con solidi programmi di gestione degli imprevisti hanno livelli di gravità degli imprevisti ben definiti e best practice chiare per definire le priorità degli imprevisti non appena si presentano.
Cosa sono i livelli di gravità?
I livelli di gravità degli imprevisti misurano l'impatto di un imprevisto sul business. In genere, quanto più il numero di gravità è basso, tanto maggiore è l'impatto dell'imprevisto.
In Atlassian, ad esempio, un imprevisto di gravità 1 è definito come "un imprevisto critico con un impatto molto elevato". Ciò potrebbe includere la perdita dei dati dei clienti, una violazione della sicurezza o la situazione in cui un servizio rivolto ai clienti è inattivo per tutti i clienti.
Un imprevisto di gravità 2 è un "imprevisto grave con un impatto elevato", ad esempio la situazione in cui un servizio rivolto ai clienti è inattivo per un sottoinsieme di clienti oppure una funzione fondamentale all'interno di un sistema non funziona.
E un imprevisto di gravità 3 è "un imprevisto minore con basso impatto", ad esempio un problema tecnico del sistema che sta causando un disagio minimo ai clienti.
In Atlassian, gli imprevisti di gravità 3 possono essere gestiti durante le ore diurne/lavorative, mentre gli imprevisti di gravità 1 e 2 generano un avviso per i professionisti su chiamata affinché individuino una correzione immediata a prescindere dall'ora del giorno.
Gravità | Descrizione | Esempi |
---|---|---|
1 | Un imprevisto critico con un impatto molto elevato |
|
2 | Un imprevisto grave con un impatto significativo |
|
3 | Un imprevisto minore a basso impatto |
|
I livelli di gravità sono utili per comprendere rapidamente l'impatto e stabilire le priorità per i team IT e i team DevOps.
Quanto più definiti sono i livelli di gravità, tanto maggiore è la probabilità che il tuo team sia sulla stessa pagina e in grado di reagire agli imprevisti in modo rapido e appropriato. In assenza di livelli di gravità adeguatamente definiti, si corre facilmente il rischio di perdere del tempo essenziale per definire e spiegare l'urgenza di un imprevisto invece di risolverlo.
Quando e dove sono utili i livelli di gravità?
Il valore fondamentale dei livelli di gravità risiede nel fatto che fanno risparmiare tempo ai team. Un team con livelli di gravità e una roadmap chiara per affrontare ogni livello è un team che può individuare subito una correzione. È probabile che un team senza livelli di gravità trascorra i primi minuti cruciali di un imprevisto grave per capire quanto sia importante, chi debba gestirlo e come gestirlo.
Più l'imprevisto è critico, più è importante risparmiare la maggiore quantità di tempo possibile pianificando in anticipo non solo mediante la risoluzione degli imprevisti e i piani di comunicazione, ma anche con i livelli di gravità e le priorità.
Quali sono le differenze tra gravità e priorità?
A prima vista, la gravità di un imprevisto sembra equivalere alla sua priorità. Dopotutto, un imprevisto grave con conseguenze disastrose dovrebbe essere affrontato prima di un imprevisto meno grave, giusto?
Ma la verità è che per la maggior parte delle aziende non è così semplice.
La gravità è un indice dell'impatto. Qual è l'impatto di un imprevisto sugli utenti? Mette a repentaglio l'intero sistema? Impedisce di completare un'attività fondamentale? O semplicemente infastidisce gli utenti e rende più complesse le attività?
La priorità, invece, è un indice dell'urgenza. Con quale urgenza dobbiamo risolvere questo problema? Quale problema deve essere risolto per primo?
A volte, gravità e priorità sono perfettamente allineate. Un imprevisto di elevata gravità che colpisce l'intera azienda è probabilmente la massima priorità su cui devono concentrarsi i team DevOps e IT.
Altre volte, invece, non sono allineate. Ad esempio: supponiamo che ci sia un errore di battitura nel titolo della home page del tuo sito Web. Si tratta di un problema di bassa gravità perché in realtà non influisce sul funzionamento del sito Web, gli utenti possono comunque continuare le loro attività e i dipendenti hanno comunque a disposizione tutto ciò di cui hanno bisogno.
Ma l'azienda potrebbe vedere la correzione come priorità assoluta per motivi di standard del marchio o perché causa confusione o semplicemente perché ne compromette l'immagine. Quindi questo imprevisto potrebbe essere di bassa gravità e di alta priorità.
Allo stesso modo, supponiamo che si sia verificato un imprevisto che sta causando l'arresto anomalo della tua app: è di gravità elevata perché impedisce agli utenti di portare avanti le loro attività, ma è anche vero che sta interessando solo lo 0,05% degli utenti. In presenza di altri imprevisti con un impatto maggiore, un problema come questo potrebbe non essere della massima priorità, anche se generalmente frasi come "il sistema si sta bloccando" mettono tutti in allerta.
Entrambi gli indici, priorità e gravità, sono importanti nella gestione degli imprevisti, ma è fondamentale riconoscere quando sono allineati e quando non lo sono. Una gravità elevata non si traduce automaticamente in una priorità assoluta, così come un'alta priorità non equivale a un danno irreparabile.
Poiché la priorità è più perseguibile della gravità, è l'indice principale che utilizziamo. E poiché la gravità è spesso un fattore chiave che determina la priorità, nel nostro manuale degli imprevisti abbiamo fornito definizioni chiare per la nostra prassi di gestione degli imprevisti.
Definizione dei livelli di gravità degli imprevisti per la tua organizzazione
Non tutti gli imprevisti sono uguali e non tutte le organizzazioni li gestiscono allo stesso modo. Nel definire i livelli di gravità, nonché i relativi processi e aspettative, oltre all'impatto di un imprevisto, dovrai tenere conto dei seguenti fattori:
- Dimensione del team tecnico
- On-call Schedule
- Orari della giornata ad alto e basso traffico per il servizio
- Frequenza degli imprevisti
Questo perché ciascuno di questi fattori potrebbe influire sul modo in cui definisci i livelli di gravità.
Ad esempio, un'app usata nei mercati locali di un unico fuso orario potrebbe essere poco utilizzata nella fascia oraria compresa tra le 2 e le 7 del mattino. Quindi, se l'intero sistema non funziona alle 3 del mattino, il livello di gravità sarebbe uguale a quello di un'interruzione del sistema nelle ore di punta?
Oppure che dire di una start-up con un team di piccole dimensioni e molti imprevisti che potremmo considerare di gravità 3? Dovrebbe utilizzare il livello 3 e lasciare che il team decida quali imprevisti hanno la priorità quando se ne verificano tre contemporaneamente? Oppure dovrebbe suddividerli ulteriormente in livelli di gravità 3, 4 o 5 per distinguere tra una perdita parziale di funzionalità in un sistema rivolto ai clienti, problemi di prestazioni e un problema ancora più piccolo, come un bug che non influisce sull'usabilità del sistema ma alla fine deve essere corretto?
L'aspetto fondamentale è comprendere il tuo business, il tuo team e quali sono le definizioni di livello di gravità e di priorità adatte alle tue esigenze.
Livello 3 Atlassian | Livello 4 | Livello 5 | |
---|---|---|---|
Grav 1 | Un imprevisto critico con un impatto molto elevato. | ||
Grav 2 | Un imprevisto grave con un impatto elevato. | ||
Grav 3 | Un imprevisto minore a basso impatto. Ad esempio, un bug di sistema sta creando un inconveniente di lieve entità per i clienti. | Un imprevisto che potrebbe diventare grave qualora non venga affrontato rapidamente. | |
Gravità 4 | Una richiesta di assistenza su un problema che il cliente trova irritante ma che non influisce sul funzionamento generale del sistema. | Un piccolo imprevisto che ha un impatto sull'usabilità del prodotto ma non ne causa l'interruzione. | |
Gravità 5 | Bug o problemi di assistenza che non influiscono sull'usabilità del prodotto. |
È essenziale disporre di una soluzione di gestione degli imprevisti per l'escalation degli stessi, in modo che i team di competenza possano immediatamente scremarli e avviarne la risoluzione.
Scopri come tutte le funzionalità di gestione degli imprevisti di Jira Service Management, tra cui avvisi e pianificazione su chiamata, comunicazione collaborativa e solide funzionalità di reporting e analisi, consentono ai team di rispondere, risolvere e imparare dagli imprevisti.
Scopri di più sulla comunicazione degli imprevisti con Statuspage
In questo tutorial ti mostreremo come utilizzare i modelli di imprevisto per comunicare in modo efficace durante le interruzioni. Puoi adattarlo a molti tipi di interruzione del servizio.
Segui il tutorialModelli ed esempi di comunicazione degli imprevisti
Quando si risponde a un imprevisto, i modelli di comunicazione hanno un valore inestimabile. Scopri i modelli utilizzati dai nostri team e altri esempi di imprevisti comuni.
Leggi l'articolo