Close

Gestione degli imprevisti per i team high velocity

Pro e contro dei diversi approcci alla gestione del servizio su chiamata

Il mondo dipende dai servizi sempre attivi come mai prima d'ora. Un'interruzione può colpire milioni di persone, con un impatto reale: non possono pagare le bollette, non possono prenotare i voli, non possono fare videochiamate con i loro amici.

E se hai un bug grave, problemi di capacità o sei completamente inattivo, i clienti che dipendono dai tuoi servizi si aspettano una risposta immediata. (Lo stesso vale per i team interni.)

Gli imprevisti possono avere un impatto reale non solo in termini di dollari: costano alle aziende 700 miliardi di dollari all'anno solo nel Nord America, ma anche sulla reputazione della tua azienda, del tuo prodotto e del tuo team.

Con una posta così alta in gioco, i team hanno deciso di organizzare team IT e di sviluppo su chiamata per assicurarsi che l'organizzazione abbia a disposizione le persone giuste per risolvere un problema durante un imprevisto, indipendentemente dal momento in cui si verifica.

Una programmazione su chiamata equa, abbinata a un piano di compenso per gli operatori su chiamata, può persino promuovere una cultura della responsabilità condivisa e aiutare i tuoi team a capire meglio cosa serve per creare software e servizi resilienti, ottenendo un prodotto complessivo migliore e un minor numero di interruzioni.

Cos'è il servizio su chiamata?

Il servizio su chiamata è la prassi di designare persone specifiche che siano disponibili in orari specifici per rispondere in caso di problemi urgenti relativi al servizio, anche se non sono formalmente in servizio.

Il servizio su chiamata è una responsabilità fondamentale all'interno di molti team IT, di sviluppo, di supporto e operativi che gestiscono servizi per i quali i clienti si aspettano una disponibilità 24 ore su 24, 7 giorni su 7. I membri del team su chiamata si alternano, fornendo copertura 24 ore su 24 o solo al di fuori del normale orario lavorativo. Insieme alle soluzioni automatiche di monitoraggio e avviso, il tecnico su chiamata è autorizzato a rispondere immediatamente a qualsiasi interruzione della disponibilità del servizio.

La crescente importanza del servizio su chiamata per i team IT e software

A volte il lavoro su chiamata ha una pessima reputazione. Alcuni operatori IT anziani raccontano sgomenti di aver lavorato in team che erano troppo limitati e non hanno ottenuto il supporto di cui avevano bisogno per rispondere adeguatamente agli imprevisti.

Molta di quell'ansia può essere alleviata se l'assistenza su chiamata viene effettuata correttamente. Con un piano su chiamata efficace, puoi assicurarti che il tuo team sia in grado di adattarsi a servizi in espansione, fornendo una copertura coerente per le funzioni IT critiche e una risposta agli imprevisti tempestiva.

I vantaggi forniti da un buon piano di gestione del servizio su chiamata va ben oltre il superamento del tempo di inattività. Ad ogni errore, i team hanno l'opportunità di acquisire nuove competenze, come comprendere un po' meglio un servizio fondamentale, capire come risponde ai guasti e sapere come progettare per ridurre il numero di guasti o migliorare il piano di risposta agli imprevisti.

Avere un buon programma su chiamata basato su una cultura della responsabilità condivisa può anche aumentare il cameratismo e ridurre il burnout, il che a sua volta può portare a una maggiore fidelizzazione dei dipendenti.

Pro e contro della reperibilità

Nelle organizzazioni che praticano DevOps, i team del software si assumono gran parte della responsabilità per l'affidabilità e la disponibilità dei servizi che sviluppano, un compito che era il dominio esclusivo dei team operativi. Per molti di questi team "You Build It, You Run It" è il nuovo motto. Avendo più familiarità con il codice, gli sviluppatori sono spesso quelli che possono risolvere i problemi meglio e nel più breve tempo possibile.

E, attraverso questo processo, gli sviluppatori sviluppano un software migliore che in realtà ha meno probabilità di fallire. Con questo slittamento delle responsabilità, testano il loro codice in modo più rigoroso poiché potrebbero essere svegliati durante le ore di riposo in caso di problemi con il servizio.

Il risultato sono sistemi più resilienti e, con un maggior numero di persone disponibili e in grado di affrontare gli imprevisti, il numero di lavoratori esauriti si riduce.

Senza un buon programma su chiamata, le organizzazioni non riusciranno a realizzare tutti i vantaggi culturali del DevOps o a soddisfare le esigenze di un'infrastruttura scalabile. Se un team si assume l'onere di rispondere agli imprevisti più di un altro, non sarà in grado di svolgere bene il proprio lavoro quotidiano. Gli sviluppatori non riusciranno a implementare il feedback proveniente dagli imprevisti e gli addetti agli imprevisti non avranno la capacità di rafforzare i propri sistemi.

Se le responsabilità sono sbilanciate, le persone a cui è assegnato il servizio su chiamata non sono mai realmente in grado di staccare dal lavoro e possono facilmente soccombere al burnout.

Ma un piano che tenga conto dei reali requisiti di copertura dell'organizzazione, bilanci il carico di tempo tra i team di sviluppo e operativi IT e acquisisca dati per il miglioramento continuo può offrire vantaggi a tutto tondo. Infatti, non solo aiuterà a offrire un servizio migliore ai clienti, ma potrà anche aiutare i dipendenti a migliorare le proprie competenze e il proprio prodotto e sorprendentemente a non vedere l'ora di essere reperibili.

Come migliorare i ruoli di sviluppatore su chiamata

Nessun tecnico ha mai detto: "Non vedo l'ora di passare la serata a supervisionare questa distribuzione e a rispondere a potenziali interruzioni!".

Con più sviluppatori che si assumono il ruolo di responsabile della manutenzione dei servizi che sviluppano, è importante assicurarsi che siano pronti ad adempiere alle loro responsabilità su chiamata e il momento migliore per valutarlo è durante il processo di assunzione.

Ora, non è un segreto che la lotta per accaparrarsi i migliori talenti ingegneristici sia feroce. E non tutti sono motivati solo dal denaro, quindi pagare di più gli sviluppatori per il lavoro fuori orario potrebbe non aiutarti a chiudere l'accordo (più avanti trovi maggiori informazioni sui compensi per gli operatori su chiamate). Durante il colloquio gli ingegneri del software avranno naturalmente delle domande sulla frequenza con cui dovranno togliere tempo alla loro vita privata ed essere reperibili.

Dimostrare di avere una programmazione su chiamata documentata che distribuisca equamente le responsabilità tra un team competente di sviluppatori e SRE può aiutare a rassicurare i nuovi assunti sul fatto che la tua organizzazione ha sotto controllo la gestione del servizio su chiamata. Con un piano documentato puoi essere completamente trasparente durante il colloquio e assicurarti che i candidati siano pronti ad assumersi la responsabilità del lavoro su chiamata.

Cinque semplici modi per rendere il servizio su chiamata più intuitivo per gli sviluppatori

  1. Definire chiaramente le responsabilità su chiamata
    Le responsabilità durante il servizio su chiamata devono essere definite con chiarezza al fine di prevenire il burnout, la confusione e la frustrazione. Ti suggeriamo di documentare il tuo processo di risposta agli imprevisti e le tue aspettative in merito al significato di disponibilità su chiamata.
  2. Assicurati che gli avvisi vengano assegnati alla persona giusta
    Non sottovalutare l'importanza di configurare in maniera efficace i tuoi strumenti di avviso. Assicurarsi di avere un flusso di modifiche chiaro con le notifiche e le sostituzioni giuste può evitare molti mal di testa.
  3. Nomina addetti alla risposta primari e secondari
    La vita non si ferma solo perché qualcuno è reperibile. Proprio come un'emergenza personale inaspettata può portare uno sviluppatore offline durante la giornata lavorativa, lo stesso può accadere quando è reperibile. La presenza di una riserva limita i potenziali danni derivanti da questo tipo di interruzione.
  4. Perfeziona i tuoi orari
    I team non sono elementi statici, né dovrebbe esserlo la tua programmazione su chiamata. Consigliamo di adottare una cultura basata sulla revisione, sull'adeguamento e sul miglioramento continui delle tue pratiche su chiamata.
  5. Assicurati che abbiano accesso a tutti gli strumenti diagnostici pertinenti e che li conoscano bene
    Ogni team adotta strumenti diversi per monitorare lo stato operativo, le prestazioni delle applicazioni, l'utilizzo delle risorse, ecc., Assicurati che i tuoi tecnici su chiamata conoscano gli strumenti utilizzati e abbiano un accesso adeguato ad essi.

Come migliorare il servizio su chiamata per i ruoli di assistenza e supporto IT

Non sono solo gli sviluppatori a dedicare più tempo alle chiamate. Sempre più spesso per i team del supporto IT e dei servizi IT, l'assistenza 24 ore su 24 è fondamentale per garantire il funzionamento dell'azienda.

Questi team affrontano molte delle stesse sfide degli sviluppatori reperibili: stress, burnout, ruoli e responsabilità poco chiari, accesso agli strumenti.

I team IT hanno spesso lo stress aggiuntivo di trovarsi nello stesso edificio dei loro clienti, i quali possono rallentare le cose con una marea di interruzioni (e-mail, Slack, anche di persona) relative all'imprevisto.

Ecco alcune tattiche per aiutare a mantenere gestibili gli imprevisti IT:

  • Comunicazione rapida e trasparente: comunicare in modo proattivo gli imprevisti IT dimostra che li consideri importanti e che hai sotto controllo la situazione.
  • Tieni traccia di ciò che conta: la maggior parte dei team dell'assistenza IT utilizza qualche tipo di software di service desk. È fondamentale non limitarsi a utilizzare solo campi di immissione dati in formato libero per acquisire i dettagli di ogni ticket.
  • Implementa un sistema di monitoraggio: storicamente, molti team operativi IT monitoravano personalmente i dashboard delle prestazioni per tenere d'occhio le interruzioni. Fai un favore al team e lascia che se ne occupino gli strumenti di monitoraggio e avviso.

Compensi per gli operatori su chiamata

Un buon piano di compenso per gli operatori su chiamata premia i tuoi dipendenti per la loro esperienza e il tempo impiegato a lavorare fuori orario. Se i dipendenti si sentono valorizzati, a loro volta si preoccuperanno dell'azienda contribuendo al suo successo.

Sulla base della Fair Labor Standard Act (FLSA) degli Stati Uniti, una legge federale che stabilisce requisiti come il salario minimo, gli straordinari e l'età minima per datori di lavoro e dipendenti, se un dipendente è reperibile ma è libero di fare ciò che desidera con il proprio tempo è considerato "in attesa di essere impiegato" e quindi non sta lavorando.

Se qualcuno ha un tempo libero limitato e non può fare ciò che desidera durante le sue ore libere, secondo l'FSLA questo periodo di reperibilità può essere considerato come "ore lavorate" e dare diritto a un compenso.

Le tue leggi locali possono variare, quindi assicurati di consultare un esperto. Da lì, punta a implementare un piano di compenso per gli operatori su chiamata che sia competitivo ed equo e sostenga una cultura della responsabilità condivisa.

Diversi tipi di piani di compenso per gli operatori su chiamata

1. Incentivo su chiamata

I piani di compenso per gli operatori su chiamata che includono incentivi premiano i dipendenti che accettano di lavorare al di fuori degli orari di lavoro in cambio di giorni di ferie extra, orari flessibili, stipendi base più alti o una combinazione di questi elementi.

Il vantaggio di questo approccio ai compensi per gli operatori su chiamata è un maggiore senso di proprietà sui servizi, che può portare allo sviluppo di sistemi più resilienti.

Anche concedere molto tempo libero e fornire compensi concorrenziali è un modo per fare sapere ai dipendenti che il loro lavoro è apprezzato, prevenendo il burnout e riducendo il turnover.

2. Retribuzione su chiamata per gli straordinari programmati

I compensi per gli operatori su chiamata permettono ai dipendenti di ricevere compensi diretti per il tempo che trascorrono in reperibilità, anche se non ricevono ticket durante il loro turno.

L'ovvio vantaggio di questo modello di compensi per gli operatori su chiamata è l'incentivo tangibile. Sapere di ricevere un compenso per aver portato con sé un cercapersone (o, più probabilmente, un laptop e un telefono cellulare) rende più facile giustificare l'onere della reperibilità e della disponibilità, anche in assenza di problemi.

3. Retribuzione su chiamata per il tempo dedicato alla risoluzione dei ticket

Un altro approccio ai compensi per gli operatori su chiamata consiste nel pagare i dipendenti solo quando si occupano di un imprevisto. Alcuni modi per calcolarlo sono:

  • Importo totale pagato per lavorare su chiamata
  • Tariffa oraria per il tempo impiegato a lavorare su avvisi/ticket
  • Tariffa per il numero di avvisi e ticket risolti

Il vantaggio di questo modello è che i dipendenti sono pagati per il lavoro extra svolto al di fuori del normale orario lavorativo. Un potenziale inconveniente è che esiste un disincentivo finanziario alla riduzione degli avvisi e dei ticket, che potrebbe compromettere l'integrità complessiva dei sistemi.

4. Retribuzione su chiamata per gli straordinari programmati e il tempo dedicato alla risoluzione dei ticket

Questa è una combinazione dei due modelli precedenti. Alcune aziende forniscono un compenso sia per la reperibilità oltre a un importo aggiuntivo per gli avvisi ricevuti e i ticket risolti. Il vantaggio di questo modello di compenso per gli operatori su chiamata è che i dipendenti si sentono ben compensati per il tempo e l'impegno extra che l'organizzazione richiede loro. Inoltre, se qualcuno rimane bloccato con un ticket particolarmente difficile che invade il suo tempo personale, viene compensato finanziariamente per il suo sacrificio. Ma ancora una volta, valuta se ha senso nella tua cultura aziendale creare una ricompensa indiretta per i bug nel software.

Altri aspetti da considerare

Questi sono i modelli tipici per i piani di compenso per gli operatori su chiamata. Alcune altre cose da considerare, a seconda dei casi sono:

  • Numero di avvisi ricevuti in orario e fuori orario

Questo numero è fondamentale per determinare se hai bisogno di una copertura dopo l'orario lavorativo o di un team speciale reperibile durante l'orario lavorativo.

  • Tempo impiegato a lavorare sugli imprevisti

La complessità e l'importanza degli imprevisti della tua organizzazione possono variare. Un tecnico reperibile può dedicare un paio di minuti a risolvere un ticket o passare l'intera notte a contrastare un imprevisto. La quantità di tempo e impegno impiegati durante un normale turno di guardia dovrebbe essere presa in considerazione e misurata per fornire un'equa compensazione.

  • Tempo medio di riconoscimento o risoluzione

In base alle escalation policy, il tempo di riconoscimento è fondamentale per una risoluzione rapida. Calcolare il tempo medio necessario per riconoscere e risolvere un problema in un determinato periodo di tempo aiuta i manager a decidere quali incentivi aggiuntivi offrire.

Conclusione

Con gli strumenti giusti, allinearsi alle policy su chiamata può essere più semplice. Gestire le programmazioni su chiamata, monitorare gli avvisi e mantenere la soddisfazione e la salute dei dipendenti è possibile se si adottano le soluzioni migliori per la gestione degli imprevisti. Le funzionalità di avviso di Jira Service Management consentono ai team di centralizzare e filtrare gli avvisi in tutti gli strumenti di monitoraggio, registrazione e CI/CD per garantire una risposta rapida evitando lo stress da avvisi.

Prossimo contenuto
On call schedules