Reprise d'activité pour les produits Atlassian Data Center
Une stratégie de reprise d'activité est essentielle à tout plan de continuité de l'activité. Elle décrit les processus à suivre en cas de sinistre, afin de garantir que votre entreprise se rétablisse et poursuive ses activités.
Qu'est-ce que la reprise d'activité ?
Pour les produits Data Center d'Atlassian, cela signifie garantir leur disponibilité en cas d'indisponibilité de votre instance principale. Dans l'ensemble de nos produits Data Center, la reprise d'activité inclut généralement la mise en place d'une stratégie en « cold-standby ». En bref, vous ne pouvez pas vous permettre une interruption complète de vos activités, c'est pourquoi une stratégie de basculement est un élément fondamental de toute planification de haute disponibilité et de reprise d'activité.
Grâce à la reprise d'activité pour les produits Data Center d'Atlassian, vous pouvez configurer la réplication des index, les mises à jour des pièces jointes et la synchronisation des bases de données afin de répondre aux exigences spécifiques de votre plan de reprise d'activité.
Types de plans de reprise d'activité
Les incidents informatiques peuvent résulter de circonstances naturelles ou causées par l'homme, notamment de cybermenaces, d'erreurs humaines, d'une mauvaise planification et d'un matériel ou d'un logiciel défectueux. Quelle que soit la manière dont se produit une catastrophe, les temps d'arrêt entraînent des pertes de productivité et de revenus. Plus l'organisation est grande, plus les équipes sont tributaires de l'efficacité du plan de reprise d'activité.
Des plans de reprise d'activité doivent être créés pour chaque outil sur lequel s'appuie une organisation, y compris les produits auto-gérés (comme les produits Data Center d'Atlassian) ou les produits hébergés dans le cloud. Ces dernières années, les outils de reprise d'activité en tant que service (DRaaS) ont gagné en popularité et fournissent des services de réplication et d'hébergement tiers pour assurer le basculement vers un autre site.
En fonction de l'infrastructure utilisée par votre organisation, vous pouvez également avoir besoin de créer un plan de reprise d'activité pour couvrir les aspects physiques de votre infrastructure informatique, de l'infrastructure réseau de votre entreprise et de toutes les machines virtuelles utilisées.
Avantages d'un plan de reprise d'activité
Un plan de reprise d'activité est un processus documenté qui permet de récupérer rapidement les apps métier critiques à la suite d'un sinistre. Mais tant qu'aucun sinistre ne survient, ces plans restent essentiellement théoriques.
Les avantages d'un plan de reprise d'activité incluent l'accélération des délais de récupération et la réduction des risques de temps d'arrêt ou de perte de données en cas de sinistre.
Trois éléments orienteront votre plan de reprise d'activité : l'objectif de point de récupération (RPO), l'objectif de temps de récupération (RTO) et l'objectif de coûts de récupération (RCO).
Objectif de point de reprise
L'objectif de point de récupération détermine le degré de mise à jour de vos systèmes que vous exigez après une panne, ou la quantité de données que vous pouvez vous permettre de perdre en cas de panne.
Durée maximale d’interruption admissible
L'objectif de temps de récupération est la rapidité avec laquelle vous souhaitez que votre système de secours soit disponible après une panne.
Objectif de coûts de récupération
L'objectif de coûts de récupération est le montant que vous souhaitez dépenser pour votre solution ou plan de reprise d'activité.
Configuration des produits Data Center pour implémenter une stratégie de reprise d'activité
Assurez la continuité de l'activité et maintenez votre objectif de temps de récupération, même en cas de panne complète du système ou du site, en configurant les produits Atlassian Data Center afin d'implémenter une stratégie de reprise d'activité. Avec les versions Data Center de Jira, Confluence et Bitbucket, votre équipe peut configurer des instances en « cold-standby » en cas de sinistre.
Pour commencer, votre équipe devra créer un système de secours sans l'activer. Ensuite, vous devrez implémenter une stratégie de réplication des données. La réplication des données vers votre site de secours est cruciale pour une stratégie en « cold-standby ». Vous ne voudriez pas basculer sur votre instance de secours et découvrir qu'elle est obsolète ou qu'il faudra plusieurs heures pour réindexer votre base de données.
Notez que tant que vous disposez d'une licence Data Center active, vous n'aurez pas besoin d'acheter des licences supplémentaires ou distinctes pour lancer Jira, Confluence ou Bitbucket sur une instance en « cold-standby ».
Tests de reprise d'activité
Les équipes de services d'urgence, comme les pompiers et les médecins, mettent régulièrement en pratique leurs compétences en matière de sauvetage, et votre équipe devrait en faire autant. Avec de l'entraînement, votre équipe se familiarisera et se sentira à l'aise face à une situation de haute pression, ce qui permettra une résolution plus rapide et plus heureuse.
Pour Jira, Confluence et Bitbucket, nous vous suggérons d'isoler les données de production avant d'effectuer tout test de reprise d'activité. Ensuite, assurez-vous que votre système de basculement est prêt et exécutez l'app. N'oubliez pas de surveiller vos fichiers journaux et de vérifier les problèmes de cohérence. Après les tests, réinitialisez votre déploiement de reprise d'activité en restaurant les composants de secours à un état où la réplication peut se produire. Dans de nombreux cas, il peut être plus facile de reconfigurer votre infrastructure de secours.
Continuité de l'activité et reprise d'activité
Les termes « continuité de l'activité » et « reprise d'activité » sont souvent utilisés de manière interchangeable, mais ils recouvrent en fait des concepts différents.
Continuité de l'activité
La planification de la continuité de l'activité désigne à une stratégie qui permet à une organisation de fonctionner avec un minimum de temps d'arrêt.
La première étape de la planification de la continuité de l'activité est le développement d'une analyse d'impact métier, qui devrait inclure l'évaluation et la définition des priorités des fonctions métier, et l'identification de l'impact potentiel d'un problème informatique. Les analyses d'impact métier peuvent également inclure des estimations des temps d'arrêt maximaux autorisés et des objectifs de temps de récupération. Il est important de réaliser une analyse d'impact métier afin d'identifier les dépendances potentielles.
L'évaluation des risques est la prochaine étape de la création d'un plan de continuité de l'activité. À l'aide de l'analyse d'impact métier, une organisation doit analyser les menaces et prendre en compte la probabilité et la gravité des sinistres potentiels. Ensuite, elle peut définir les priorités de ses processus métier et effectuer une analyse des écarts par rapport à ses politiques existantes. Les évaluations des risques peuvent également influencer la volonté de l'organisation d'investir pour améliorer ses performances.
Reprise après sinistre
La reprise d'activité est un sous-ensemble de la continuité de l'activité qui désigne les processus qu'une organisation doit suivre en cas de sinistre, pour s'assurer qu'elle peut se rétablir et continuer à fonctionner. Un plan de reprise d'activité réussi tiendra compte des besoins identifiés dans l'analyse d'impact métier et l'évaluation des risques.
Ressources de reprise d'activité
Facilitez la reprise d'activité Git avec Bitbucket Data Center
Reprise d'activité pour Atlassian Data Center
Guide de reprise d'activité pour Jira
Planifiez pour l'avenir
Avec les produits Atlassian Data Center, vous pouvez assurer la continuité de l'activité et maintenir votre objectif de temps de récupération, même en cas de panne complète du système ou d'un site