Gestione degli imprevisti per i team high velocity
Best practice per la comunicazione degli imprevisti
Gli imprevisti sono sempre stati un dato di fatto per le persone che si occupano di IT e operazioni. Oggi, anche DevOps e i team di assistenza clienti stanno seguendo un corso accelerato sulla comunicazione degli imprevisti.
Tramite il processo di comunicazione degli imprevisti, si avvisano gli utenti dell'interruzione o della riduzione delle prestazioni dei servizi. Questo processo è particolarmente importante per i servizi Web e software, da cui ci si aspetta disponibilità 24 ore su 24, 7 giorni su 7.
La comunicazione degli imprevisti su scala Web è più complessa del semplice invio di e-mail in blocco poiché occorre considerare tipi di pubblico diversi e soglie diverse per le aspettative di messaggistica e risposta.
Dal momento che i tempi di inattività sono inevitabili, è meglio pianificare in anticipo e assicurarsi che il team sia pronto.
Nella nostra guida alle best practice di comunicazione degli imprevisti affronteremo gli argomenti seguenti:
- Perché la comunicazione degli imprevisti è importante
- Come prepararsi per la comunicazione degli imprevisti
- In che modo i professionisti della comunicazione degli imprevisti gestiscono l'attività
- Perché la comunicazione degli imprevisti non termina dopo l'imprevisto
Comunicazione degli imprevisti: a chi interessa?
Interessa ai tuoi clienti e ai tuoi colleghi. E dovrebbe interessare anche a te. La gestione inappropriata dei tempi di inattività può avere effetti negativi sui tuoi clienti, sui tuoi team e sui tuoi profitti. Alcuni dei tuoi clienti potrebbero temere che il problema possa ripetersi e decidere di passare a un concorrente. La mancanza di fiducia ti farà perdere clienti futuri. Il morale del team può soffrirne e ciò può portare a una minore produttività. Inoltre, non potrai più usufruire del passaparola.
Fortunatamente, tempi di inattività non devono necessariamente tradursi in un incubo per il servizio clienti. È stato dimostrato che se tieni aggiornati i tuoi clienti comunicando cosa sta succedendo e cosa stai facendo per risolvere il problema, capiranno e avranno una reazione molto meno negativa all'intera situazione.
Preparazione per la comunicazione degli imprevisti
Una preparazione adeguata impedisce prestazioni scadenti. Usa questo slogan per la tua strategia di comunicazione degli imprevisti. Quando sei nel vivo di un imprevisto, sarai felice di aver dedicato del tempo alla comunicazione degli imprevisti.
Definizione di ciò che deve essere considerato un imprevisto
Prima di poter comunicare gli imprevisti, dobbiamo decidere cosa costituisce un imprevisto. Molte aziende Web si affidano a un sistema standardizzato di definizione della gravità di 4 livelli. Nel nostro Manuale sugli imprevisti trovi una guida molto utile alla definizione della gravità.
Qualsiasi siano le soglie di gravità degli imprevisti, è importante tracciare una linea chiara (idealmente attorno a una sorta di metrica misurabile). Se si contrassegna un imprevisto con un livello di gravità 1, è importante che tutti i membri del team siano in grado di sapere esattamente cosa significa.
Un sistema di gravità è utile anche per eliminare le sfumature intrinseche di grigio associate ai tempo di inattività.
Indipendentemente dal sistema utilizzato, consigliamo un piano di comunicazione a tolleranza zero per eventuali imprevisti che comportano problemi di sicurezza o perdita di dati.
Scelta anticipata di soluzioni di comunicazione, canali e modelli di messaggi
I team di supporto professionisti e gli ingegneri responsabili dell'affidabilità del sito non decidono sul momento su quali canali comunicare. Lo pianificano in anticipo.
Esistono cinque canali di comunicazione principali per la comunicazione degli imprevisti:
- Pagina di stato dedicata
- Stato incorporato
- Strumento di chat sul posto di lavoro
- Social network
- SMS
Pagina di stato dedicata
Consigliamo ai team di utilizzare una pagina di stato dedicata come soluzione principale per la comunicazione degli imprevisti. Che ne crei una personalizzata o che utilizzi una soluzione ospitata come Statuspage, è importante fornire ai tuoi clienti e colleghi una chiara fonte di verità durante un imprevisto. Statuspage offre inoltre ai tuoi utenti la possibilità di iscriversi per ricevere aggiornamenti nel momento in cui vengono pubblicati. Questo allevia il carico dalle spalle dei team che dovrebbero occuparsi di risolvere il problema.
Stato incorporato
Statuspage rende anche più semplice integrare le informazioni sullo stato direttamente su qualsiasi sito Web che i clienti gestiscono. Sappiamo che è probabile che la maggior parte dei visitatori controlli la home page o la pagina di supporto di un provider prima di cercare una pagina di stato. Il widget incorporato (qui trovi un esempio) è un modo semplice per far sapere ai visitatori se è in corso un imprevisto. Questi ultimi possono anche cliccare sul widget per accedere alla pagina di stato.
Con un prodotto come Statuspage a tua disposizione, puoi permettere al tuo pubblico di iscriversi agli aggiornamenti via e-mail. Che tu stia inviando direttamente dal tuo strumento di posta elettronica o utilizzando una pagina di stato per attivare l'invio di e-mail, invia un'e-mail a un canale affidabile per la comunicazione degli imprevisti.
Strumenti di chat
Semplifica la vita di agenti e dipendenti riducendo il passaggio da un contesto all'altro e le lacune informative con la chat di Jira Service Management. La chat di Jira Service Management consente di sincronizzare le conversazioni in Slack o Microsoft Teams e i tuoi ticket. Una conversazione fluida tra i più richiesti strumenti di chat e l'assistenza aiuta a fornire un contesto solido a un problema, portando a una risoluzione rapida.
Social network
Molti team utilizzano canali social come Twitter come mezzo di comunicazione durante un imprevisto. È bene utilizzarlo come parte della tua strategia, ma non fare affidamento su di esso come unico mezzo di comunicazione.
SMS
Ricevere un messaggio SMS o un messaggio di testo è spesso un modo più immediato per raggiungere qualcuno e molte persone preferiscono una soluzione di questo tipo quando si tratta di avvisi in entrata critici come un annuncio di tempo di inattività. Di contro è anche un canale che può spingere le persone ad annullare l'iscrizione se ricevono troppi messaggi che non sono rilevanti per loro.
Nessuno di questi canali è la soluzione ottimale per le comunicazioni relative agli imprevisti. Tutti hanno punti di forza diversi e per sfruttarne il pieno valore bisogna utilizzarli di concerto. Ad esempio, in Atlassian, pubblichiamo gli imprevisti su una pagina di stato ma inviamo gli aggiornamenti anche su Twitter. Un annuncio sull'imprevisto è visibile anche sul nostro portale Jira Service Management. Questi messaggi reindirizzano quindi l'utente alla pagina di stato per ulteriori dettagli sull'imprevisto. La gestione degli imprevisti in Jira Service Management consente molteplici punti di comunicazione senza intralciare o perdere la fiducia dei clienti nella traduzione.
Personalizzazione di avvisi e comunicazioni per il pubblico giusto
Quando si verifica un imprevisto, è necessario sapere a chi segnalarlo, come raggiungere tali persone e come farlo evitando il più possibile di creare attriti e usando il minor numero possibile di risorse per evitare che si trasformi in un incubo per l'assistenza clienti e/o un disastro in termini di comunicazione. È meglio iniziare internamente con un team di risposta immediata e lavorare verso l'esterno, curando i messaggi per il pubblico appropriato.
Sebbene ogni organizzazione sia diversa, in generale è utile pensare a questi segmenti di pubblico come a 5 gruppi distinti con cui è necessario comunicare:
- Team su chiamata principale: il primo a sapere che qualcosa non va, quasi immediatamente dopo l'impatto (di solito da strumenti di monitoraggio e avviso). I team interni lavorano dietro le quinte per rilevare, scremare, contestualizzare e risolvere gli imprevisti con strumenti di comunicazione collaborativa.
- Team di supporto in prima linea: coloro che risponderanno direttamente alle domande e forniranno aggiornamenti ai clienti durante l'imprevisto. È un ruolo incredibilmente importante, quindi questo team deve ottenere le informazioni giuste da trasmettere agli utenti finali.
- Manager e team esecutivo: il team principale deve comunicare con questo gruppo in modo da informarlo su cosa sta succedendo e sul potenziale impatto sui due gruppi seguenti e, si spera, da fornire una stima della possibile durata.
- Popolazione generale dei dipendenti: i dipendenti devono essere tenuti informati sull'interruzione e sul ripristino dei servizi su cui fanno affidamento. Comunicare in modo proattivo con questi utenti consente di ridurre il numero di domande sullo stato di un imprevisto e di ticket di supporto IT duplicati e di dedicare maggiore attenzione alla risoluzione del problema in questione.
- Clienti esterni: se l'imprevisto riguarda clienti esterni, è necessario inviare alcune comunicazioni per spiegare il problema e spiegare quando possono aspettarsi una soluzione o almeno un aggiornamento ogni volta che trascorre una determinata quantità di tempo. In caso di imprevisti che continuano a compromettere la capacità dei tuoi clienti di utilizzare il tuo prodotto, ti consigliamo di non far trascorrere mai più di un'ora senza inviare un aggiornamento. Dovresti anche indicare sempre quando possono aspettarsi di ricevere il prossimo aggiornamento. Se si tratta di un imprevisto abbastanza grave, in particolare un imprevisto che riguardi la sicurezza o la perdita di dati, vorrai sicuramente accelerare le comunicazioni esterne e coinvolgere gli altri team necessari (legale, HR, sicurezza, ecc.)
Impostazione di modelli per la comunicazione di imprevisti e interruzioni
Nel vivo di un imprevisto, l'ultima cosa di cui ti devi preoccupare è come trovare le parole giusto per scrivere un annuncio di imprevisto. Formulando l'annuncio nel modo sbagliato potresti dare adito ai manager non tecnici alla costante ricerca di qualsiasi motivo per criticare il processo di risposta del tuo team di puntare il dito contro di te.
Stabilisci il linguaggio comune in anticipo, fallo approvare dai tuoi manager e salvalo in un modello. In questo modo è facile inserire i dettagli pertinenti e risolvere un imprevisto il giorno stesso.
Di seguito sono riportati due dei modelli di imprevisti che utilizziamo per la nostra pagina di stato:
- Al momento il sito sta registrando una quantità di caricamento superiore al normale e potrebbe causare il rallentamento del caricamento delle pagine. Stiamo indagando sulla causa e forniremo un aggiornamento il prima possibile.
- Il nostro fornitore di storage per i dati delle metriche pubbliche sta attualmente riscontrando problemi di infrastruttura. Aggiornamenti saranno resi disponibili man mano che la situazione si sviluppa o ci vengono fornite informazioni.
Scopri altri esempi nella nostra raccolta di modelli di imprevisti.
Gestione professionale della comunicazione
Il ciclo di vita di un imprev isto includerà probabilmente diversi punti di contatto. Ogni imprevisto presenta una struttura ricorrente in 3 atti: primo contatto, aggiornamenti durante l'imprevisto, risoluzione e analisi retrospettiva.
Prologo: comunicazione centralizzata interna al team
Prima di qualsiasi altra cosa, i team interni sul back-end di un imprevisto dovrebbero disporre di una piattaforma di comunicazione consolidata ed essere pronti a collaborare quando si presenta un problema.
La centralizzazione e il filtraggio degli avvisi attraverso strumenti di monitoraggio, registrazione e CI/CD garantiscono una risposta rapida da parte del team. Con una piattaforma come Jira Service Management, i team possono rapidamente collaborare alla risoluzione di un imprevisto, acquisire contesto e rimanere in contatto per tutta la durata dell'imprevisto.
Parte 1: Primo contatto
L'aggiornamento iniziale è il più importante. Tutto, da quello che dici, a come e quando lo dici, dà il tono a come verrà percepita la tua risposta. È qui che aiuta davvero avere un modello preparato in anticipo.
Il tuo obiettivo dovrebbe essere quello di prendere atto rapidamente del problema, riassumere brevemente l'impatto noto, promettere ulteriori aggiornamenti e, se possibile, alleviare eventuali timori sulla sicurezza o sulla perdita di dati. È importante prendere atto dell'esistenza di un problema, anche se non si conoscono ancora i dettagli esatti.
Parte 2: Aggiornamenti regolari durante l'imprevisto
La comunicazione durante l'imprevisto è fondamentale.
I team SRE di Google indicano il Coordinatore comunicazioni come uno dei ruoli chiave che devono essere assegnati durante un imprevisto.
Dal libro di Google "Site Reliability Engineering" sul ruolo del coordinatore della comunicazione:
Questa persona è il volto pubblico della task force per la risposta agli imprevisti. "I suoi compiti includono sicuramente l'emissione di aggiornamenti periodici al team di risposta agli imprevisti e agli stakeholder (di solito via e-mail) e possono estendersi ad attività come assicurarsi che il documento relativo all'imprevisto sia sempre accurato e aggiornato".
Questa persona dovrà anche occuparsi di continuare ad aggiornare la pagina di stato o pubblicare aggiornamenti su altri canali man mano che la situazione si evolve. Anche un aggiornamento del tipo "Stiamo ancora lavorando sul problema, niente di nuovo da segnalare" è meglio che non dire nulla e lasciare il pubblico in sospeso. Le persone lasciate al buio iniziano ad aspettarsi il peggio.
Comunicare con gli utenti e gli altri stakeholder è fondamentale. Usa i tuoi canali predeterminati per spiegare agli utenti cosa sta succedendo. In una home page, questo potrebbe essere un avviso di Statuspage per segnalare ai clienti che il tuo team è a conoscenza del problema ed evitare agli agenti di ricevere messaggi ridondanti. Tieni aggiornati i clienti utilizzando diversi canali di notifica, tra cui SMS, e-mail e notifiche push su dispositivo mobile.
Qualunque strumento tu scelga di utilizzare, ti consigliamo di identificarne uno come veicolo di comunicazione principale e di incanalare tutte le parti interessate lì dagli altri canali. La gestione delle comunicazioni relative agli imprevisti tramite Jira Service Management garantisce che i messaggi giusti arrivino alle persone giuste.
Parte 3: Risoluzione, analisi retrospettiva, cosa viene dopo
Nel 2010, Facebook ha subito la sua più grande interruzione fino ad oggi. Per circa 2,5 ore, il social network non era disponibile per milioni del suo mezzo miliardo di utenti di allora.
Il momento non avrebbe potuto essere peggiore per il fiorente gigante della tecnologia, che era ancora agli inizi della sua crescita esplosiva degli utenti e stava ancora dimostrando al mondo degli affari che il servizio valeva l'hype intorno ad esso.
Quando il polverone è passato, un ingegnere di Facebook ha pubblicato un riepilogo di 395 parole sul blog tecnico dell'azienda sull'imprevisto.
Dal blog:
Stamani Facebook è stato inattivo o irraggiungibile per molti di voi per circa 2,5 ore. Questa è la peggiore interruzione che abbiamo avuto in più di quattro anni e volevamo prima di tutto scusarci per l'inconveniente. Volevamo anche fornire molti più dettagli tecnici su ciò che è successo e condividere una grande lezione appresa.
Lo schema dell'analisi retrospettiva è semplice:
- Riconosci il problema, entra in empatia con le persone colpite e chiedi scusa
- Spiega cosa è andato storto e perché
- Spiega cosa è stato fatto per risolvere l'imprevisto e cosa è stato fatto per impedire che l'imprevisto si ripeta
- Riconosci il problema, empatizza e chiedi scusa ancora una volta
In questo tipo di comunicazioni non c'è bisogno di un linguaggio fiorito o di affermazioni grandiose Usa parole semplici e dirette. Ad esempio, dal blog di Facebook:
Ci scusiamo ancora per l'interruzione del sito e vogliamo che tu sappia che prendiamo molto sul serio le prestazioni e l'affidabilità di Facebook.
Questo tipo di linguaggio consente ai tuoi clienti e colleghi di avere la certezza che stai gestendo una team attento e stai tenendo d'occhio la palla. Sfoglia il nostro modello di analisi retrospettiva della risposta agli imprevisti per altre idee.
La realtà dell'esecuzione di servizi sempre attivi è che a volte le cose si rompono inaspettatamente. Comunicare efficacemente durante i tempi di inattività può effettivamente creare un clima di fiducia sia con i colleghi che con i clienti. Rispondere bene può davvero fare la differenza. Abbiamo anche creato questo semplice strumento per aiutarti a scrivere rapidamente comunicazioni efficaci durante gli imprevisti.
Prodotti trattati
Comunica agevolmente agli utenti lo stato in tempo reale.
Scopri di più sulla comunicazione degli imprevisti con Statuspage
In questo tutorial ti mostreremo come utilizzare i modelli di imprevisto per comunicare in modo efficace durante le interruzioni. Puoi adattarlo a molti tipi di interruzione del servizio.
Segui il tutorialModelli ed esempi di comunicazione degli imprevisti
Quando si risponde a un imprevisto, i modelli di comunicazione hanno un valore inestimabile. Scopri i modelli utilizzati dai nostri team e altri esempi di imprevisti comuni.
Leggi l'articolo