事後分析レポートの作成
データの収集と文書化が、インシデントの事後分析のプロセスの鍵となる理由
インシデントの事後分析は、2 つの異なる成果物に分けられます。インシデントが議論される会議と、その会議の成果として作成された対応する事後分析レポートです。
これらの 2 つの活動、つまり会議と報告は、多くの場合、人々が「事後分析」を参照するときに同じ意味で使用されます。この用語を使うとき、どちらか、または両方を言及しています。
事後分析テンプレートを探していますか? この事後分析テンプレートをご確認ください。
しかし、事後分析会議と事後分析レポートには違いがあります。
Atlassian では、通常、事後分析またはインシデントの事後分析を使用して、次を含むインシデントを分析するプロセス全体を記述します。
- インシデントの事後分析会議を実施する
- 会議中のアクションと情報を記録する
- フォローアップ行動の承認を取得して会議の結果を伝達する
Atlassian が事後分析をどのように管理しているかについては、インシデント管理ハンドブックをご参照ください。
良いインシデントの事後分析報告書を作成するポイント
明確で一貫したプロンプト
良いレポートは、明確で一貫したフレームワークに基づいている必要があります。効果的なチームはすべての事後分析をテンプレートに設定して、参加者は一連の質問やプロンプトに答えます。
これによって、重要な詳細が忘れられないようになります。またインシデント全体の一貫性を確保して、チームがパターン、傾向、改善の機会を特定するのに役立ちます。フレームワークは時間をかけて反復的に改善できますが、変更は目的を持ったものでなければなりません。
豊富な詳細とデータ
事後分析は、細部を無視して起こったことをごまかす場ではありません。それは、詳細を明確にすべき場です。単にトラフィックの急上昇とは言うのではなく、どの指標がどれぐらい変化したかを正確に述べてください。チームが混乱したとは言わず、誰かが混乱を表明したチャット履歴から正確に引用してください。
包摂的で誰も責めることのない表現
多くのチームと同様に、Atlassian では誰も責めることのない事後分析を実践しています。会議やインシデントの分析において、誰も責めないことが重要です。しかし、レポートの表現にも同じ注意が必要です。誰かを責めたり名指ししたりする表現を避けてください。
事後分析報告の際に聞くべき重要な質問
Opsgenie の事後分析機能に含まれるプロンプトは次のとおりです。
- リードアップ
このインシデントを引き起こした状況を説明します。
- 不具合
何が期待どおりに動作しなかったのかを説明します。
- 検出
インシデントがどのように検出されたかを説明します。
- 根本原因
5 つの Why 分析を実行して、インシデントの真の原因を理解します。
- 緩和と解決
このインシデントを解決するためにどのような手順を踏みましたか?
- 教訓
何がうまくいきましたか? 改善できることはありますか? 何を学びましたか?
事後分析レポートに含めるための質問の例については、事後分析テンプレートに関する記事をご覧ください。
事後分析報告書に他に何を含めるべきか
- スクリーンショット
関連するスクリーンショット、特に停止中に対応チームが撮影したものを添付します。製品にどのような変化がありましたか? どの製品の動作が期待どおりに発生しませんでしたか?
- チケット
インシデントに関係するチケットにリンクします。
- 顧客フィードバック
インシデントについて顧客フィードバックはありましたか? ヘルプ デスク、メール、ソーシャル メディアなどで報告される場合があります。すべてを含める必要はありません。
- チャートとグラフ
どのデータ可視化がインシデントの影響を示す上で役に立ちましたか?
- データ
インシデントまたはその影響について他の重要なデータ ポイントはありますか?
- チャットのやり取り
チームが対応中に Slack などのチャット ツールを使用していた場合は、チャット履歴から重要なメッセージまたはやり取りを含めることを検討してください。
- タイムライン
インシデントの明確なタイムラインは、インシデント分析に非常に有用です。インシデント発生中の重要なイベントとタイムスタンプを記述します。
内部および外部の事後分析報告書
あまり一般的ではないものの、インシデント後に事後分析の公開版を公開する組織もあります。これは、多くのユーザーに影響を与える停止が発生しうる大規模な消費者サービスで特に一般的です。そのようなサービスは、完全な事後分析報告書を公開したり、内部報告書の要約版を公開したりする場合があります (後者の方が可能性が高いです)。機密情報や個人情報を取り除く必要がある可能性が高いです。
重大インシデントにプロが対応する方法
無料のインシデント管理ハンドブックをご覧ください。アトラシアンが重大インシデントを管理するために使用しているすべてのツールとテクニックが記載されています。
Statuspage でインシデント コミュニケーションを学ぶ
このチュートリアルでは、システム停止時にインシデント テンプレートを使用して効果的にコミュニケーションを取る方法について説明します。さまざまなサービス中断に適応可能です。
このチュートリアルを読むインシデントの事後分析プロセスの重要性
インシデント後レビューとも呼ばれるインシデントの事後分析レビューは、インシデント中に何が起こったかを調査して教訓を取り込むのに最適な方法です。
この記事を読む