Imagine Learning + Atlassian
Imagine Learning filtert ruis uit en vermindert de waarschuwingsvermoeidheid met Opsgenie
Sector
EdTech
Locatie
Provo, Utah
Aantal gebruikers
241
Producten
Marketplace-apps
Pagina delen
Imagine Learning is een EdTech-bedrijf dat in 2004 werd opgericht en studenten bedient voor wie traditioneel lesgeven niet effectief is. De software is ontworpen voor leerlingen van de peutertijd tot middelbareschooltijd die mogelijk problemen hebben met lezen, schrijven en rekenen. Scholen kopen de software om tegemoet te komen aan leerlingen met leerproblemen en hen te helpen slagen voor hun opleiding.
De pijn van waarschuwingsmoeheid
Keith Smith trad in dienst bij Imagine Learning als Principal Site Reliability Engineer nadat hij al jaren actief was in de DevOps-ruimte. Hij was bekend met verschillende tools voor incidentbewaking, waaronder Opsgenie. Imagine Learning had veel tools, maar consolidatie en effectieve waarschuwingen ontbraken simpelweg.
"[Destijds] kreeg het oproepteam alleen waarschuwingsberichten via e-mail. Dat was dom, er was zoveel ruis. Ik stond elke avond om 1 uur op, keek naar mijn telefoon en ging weer naar bed. Ik zei daarom dat er een betere manier is."
Vanwege alle ruis waren de waarschuwingen niet zinvol en konden ze niet worden uitgevoerd. Het proces was volledig reactief en teams hadden geen efficiënte manier om te communiceren tijdens incidenten.
"Wanneer het aantal ondersteuningsoproepen toenam, wees dat op een probleem. De actieve servicemedewerker escaleerde het probleem vervolgens. Maar dat was de enige communicatieketen: de klant vertelde ons dat er iets mis was en dan zouden we het repareren."
De business case opzetten
Keith wist dat hij een tool als Opsgenie moest implementeren, maar moest een business case voor het hoger management formuleren. Dat bleek eenvoudiger dan verwacht.
"Twee weken na mijn aantreden, stelde ik waarschuwingen in en keek ik naar statistieken toen ik me realiseerde dat we 24 uur down waren geweest zonder dat we dat wisten!" Het probleem was vrij snel opgelost, maar een uitval van 24 uur was volledig te vermijden.
Hij was in wezen dé zwakke schakel geworden. Dat is niet schaalbaar of duurzaam voor een bedrijf met meer dan 500 werknemers in de VS, India en Argentinië.
Binnen 3 maanden na de invoering van Opsgenie hebben we het aantal incidenten met 900% verminderd.
Keith Smith
Principal Site Reliability Engineer
Consolidatie en verbeterde communicatie waren essentieel voor het behoud van de infrastructuur die nodig is voor het succes van het bedrijf.
"Wat als ik op vakantie ging? Wat gebeurt er met de waarschuwingen gedurende twee dagen? Ik ging naar mijn baas en ik vertelde hem dat dit niet duurzaam was en er problemen zouden ontstaan. Ik citeerde bronnen [waaronder de 24-uurs uitval] om mijn punt te bewijzen."
Een pijnlijk dienstschema met voornamelijk e-mailwaarschuwingen, een reactieve benadering van problemen en statistieken die de behoefte aan een modern incidentbeheerplatform ondersteunden, waren voldoende. Zo stapte Imagine Learning over op Opsgenie.
Betrouwbare waarschuwingen
Met meer dan 20 tools en applicaties om de mogelijkheden van Opsgenie voor integratie met hun IT-stack te beheren, was dit de sleutel tot rust.
"Elke keer wanneer ik een bron aan OG wilde koppelen, was er wel een route, al was het maar webhook."
Dankzij diepe integraties met Slack en JIRA heeft Imagine Learning nu een geautomatiseerd proces. Opsgenie werkt de statuspagina bij, maakt een Jira-ticket aan, genereert een Slack-melding en maakt de juiste mensen op het juiste moment wakker.
"Nu we elk jaar één groot incident hebben, wordt het steeds leuker. Ik kan 's nachts slapen en houd tijd over om aan andere projecten te werken."
Keith Smith
Principal Site Reliability Engineer
"Naast een snellere MTTR winnen we vooral op het gebied van communicatie. We informeren onze klanten en de 500 mensen in onze kantoren in het hele land [en over de wereld] wat er aan de hand is zodra een incident plaatsvindt."
Opluchting met Opsgenie
Door het oproepschema te delen en alleen wakker te worden wanneer dat nodig is, kan Keith zijn werk diversifiëren en de reactietijd te verkorten van 24 tot 36 uur naar hooguit 15 minuten.
Opsgenie stelde Keith in staat om een efficiënt proces voor incidentmanagement en oproepen in het leven te roepen dat de MTTR verminderde en ook het leven van zijn team verbeterde. Voor een bedrijf dat een softwareproduct levert, is het van vitaal belang om een issue snel op te lossen. Binnen 3 maanden na het gebruik van Opsgenie was het aantal incidenten met 900% gedaald.
"Nu we elk jaar één groot incident hebben, wordt het steeds leuker. Ik kan 's nachts slapen en houd tijd over om aan andere projecten te werken."
Start vandaag nog je gratis proefperiode van 14 dagen voor Opsgenie
Cloudgerichte bedrijven mogelijk maken met Opsgenie
Always-on diensten leveren door middel van Agile incidentmanagement