回復力に対するアトラシアンのアプローチ
お客様のクラウド製品と、そのための基盤となるシステムやサービスを常に利用可能な状態に保ち、悪影響や予期しない出来事の影響にも備えておくことが、私たちにとってもお客様にとっても重要なことです。お客様の製品が必要なときに使えるように、ビジネスの回復力を提供するテクノロジー、人材、プログラムを採用しました。
回復力の高い製品の構築
アトラシアンは、共同責任モデルに従ってクラウド製品を運用しています。これは、お客様とアトラシアンとの連携の元に信頼性を獲得しているということです。このモデルでは、アトラシアンは、インフラストラクチャ、製品、サービスの高可用性、信頼性、および復旧可能性の確保に責任を負います。お客様の責任は、ディザスタ リカバリ プログラムとビジネス継続性計画を導入して、不測の事態が発生した場合でもビジネスを運営できるようにすることです。
優れた可用性
クラウド サービス プロバイダーとして AWS (Amazon Web Services) を採用して、世界中の複数のリージョンで高い可用性を備えたデータ センター施設を使用しています。各 AWS リージョンは、AZ (アベイラビリティ ゾーン) として知られる、複数の独立かつ物理的に分離されたデータ センター郡を備えた個別の地理的な場所を指します。
各アベイラビリティ ゾーンは他のゾーンの障害から隔離されて、同リージョンにある他の AZ に低コストで低遅延のネットワーク接続を提供できるように設計されています。このマルチゾーンの高可用性は地理的および環境面におけるリスクの防御の第一線であり、AZ の障害があってもマルチ AZ デプロイ環境で実行されるサービスは影響を受けません。
詳細については、アーキテクチャと運用プラクティスのページをご覧ください。
信頼性
アトラシアンは、すべてのチームで信頼性の高いサービスと製品を提供するべく努力しています。確実にこれを実現するために、DR (ディザスタ リカバリ) プログラムでは、重要な IT システムとサービスにおいて高い可用性と信頼性を確保し、停止した場合には速やかに復旧できるようにするためのプロセス、ポリシー、テクノロジーの導入を重点的に行っています。
上記の機能に加えて、監視とアラートを実装し、ディザスタ リカバリ テストを実施しています。
監視とアラート
当社では、潜在的な問題を早期に検出するために、さまざまな指標を継続的に監視しています。それらの指標に基づいて、しきい値を超えた場合にはアラートがサイト信頼性エンジニア (SRE) や関連する製品エンジニアリング チームに通知されるよう設定されており、インシデント対応プロセスを通じて迅速なアクションを実行できます。
SRE は、リスク & コンプライアンス チームがコンプライアンスのフレームワークと足並みを揃えるよう働きかけることで、DR プログラムにおいても重要な役割を果たします。各チームには DR 推進者も配置され、そのチームに関連するディザスタ リカバリの状況を監督し、管理をサポートします。
ディザスタ リカバリ (DR) テスト
当社の DR テストは、関連するプロセスのドキュメンテーションや各システムでのフェイルオーバー テストなど、プロセスと技術の側面を網羅しています。これらのテストは、標準的なテーブルトップ シミュレーションの演習から、全範囲のアベイラビリティ ゾーンまたはリージョンのフェイルオーバー テストに至るまで多岐にわたります。テストの複雑さに関わらず、テスト結果を取り込んで文書化したり、改善の余地があるか分析して特定したり、それを Jira チケットを活用して修復したりするなど、プロセス全体で継続的に改善できるように努めています。
サービスの信頼性の確保
アトラシアンでは、お客様に保証する必要のある毎月の稼働時間を規定した SLA (サービス レベル アグリーメント) によって、信頼性確保への取り組みを証明しています。
さらに、RTO (目標復旧時間) および RPO (目標復旧時点) などのその他の指標も使用しています。アトラシアンのクラウド製品の信頼性に影響を及ぼす想定外の事態が発生した場合、アトラシアンは次の RPO と RTO に従って、クラウド製品の通常の運用への復旧を目指します。
RPO | 1 時間 |
---|---|
RTO | 6 時間 |
アトラシアンの製品とサービスの可用性は、Statuspage でご確認いただけます。
復旧可能性
アトラシアンでは HA (高可用性) アーキテクチャを利用しているため、クラウド製品の可用性に影響を及ぼす可能性のある重大な中断が発生した場合でもサービスを復旧させられます。ただし状況によっては、インフラストラクチャ内でのデータの破損や削除など、従来型のデータのバックアップと復旧手法を使用する必要があることもあります。
このようなシナリオに対応するために、アトラシアンでは包括的なバックアップ プログラムを運用しています。このプログラムには、システム リカバリ要件に合わせて設計されたバックアップ対策のある、社内システムおよびクラウド製品が含まれます。また、バックアップを継続的にテストするプロセスとツールが導入されています。
ただし、これらのバックアップは、お客様による破壊的な変更の復元には使用されません。たとえば、スクリプトによって上書きされたフィールド、削除された課題、プロジェクト、サイトといった変更です。データの損失を避けるため、定期的にバックアップすることをお勧めします。バックアップの作成について詳しくは、アトラシアンのドキュメントをご覧ください。
想定外の事態の影響を最小限に抑える
アトラシアンのビジネス レジリエンス チームは、確実な BC (ビジネス継続性) 手法によって、事業の中断中および中断後も、当社の重要な機能の運用を継続できるようにしています。
BC プログラムは当社の DR プログラムと連携するように設計されています。また、業界標準に沿った年間ライフサイクルに基づいてこの取り組みを行っています。取り組みの一つとして、少なくとも年に 1 回実施される BIA (事業影響度分析) プロセスがあります。これは、当社の人材、プロセス、テクノロジーを守るために必要な、効果的な継続性戦略を策定するための基礎となります。BIA の結果は、DR および BC の取り組みに関する戦略推進に直接役立ちます。そのため、当社の重要なビジネス サービスでは、重要なテクノロジーだけでなく、その背後にある人材とプロセス両方を復旧させられる、効果的な DR 計画と BC 計画を包括的に作成できます。
ビジネスの継続性を保証するためのアトラシアンの取り組み
アトラシアンでは、互いに補完し合う次の 3 つの取り組みによって、ビジネスの回復力を確保するための能力を高め、復旧戦略を策定しています。
- 演習: 既存の計画を見直すことが目的です。机上演習、機能演習、総合演習があり、計画に関与する全員が、事業が中断した場合に自分の責任を果たせるよう練習できます。演習によって関係者は、該当する事業継続計画を詳細に見直し、実際の災害発生時と同じ手順を実施できます。
- ウォーゲーム: 既存の脅威や発生する可能性のある脅威への対応のストレス テストを行えます。アトラシアンの計画ではオールハザード アプローチを採用していますが、ウォーゲームによって、発生する可能性が高いシナリオや影響の大きいシナリオへの対応のストレス テストを行うことで、当社の対応および復旧戦略が盤石であることを確認できます。
- テスト: 合格/不合格で判定し、計画が効果的であるかどうかを客観的に評価できます。これは、当社のディザスタ リカバリ戦略をテストして、その効果を測定、管理しようとする場合に最も多く利用される方法です。