実用的で信頼できるアラート
Opsgenie を使用すれば、重要なアラートを見逃しません。監視、チケット、チャットの各ツールに密接に統合することで、Opsgenie はアラートを 1 つにまとめ、ノイズを除去し、複数のチャネルを使ってチームに必要な情報を通知できるため、すばやく問題を解決できます。
複数のアラート通知チャネル
多くの監視ツールではメールで通知が送信されますが、メールはアラートが緊急で迅速な対応が求められる場合には不十分です。Opsgenie は、メール、SMS、モバイルプッシュ通知、音声通話など複数のコミュニケーションチャネルを使用して、受信者がタイムリーに通知を受けられるよう徹底します。
情報が豊富なアラート
短いテキストメッセージでは多くの場合、ユーザーが効果的な決定を下すのに十分な情報を伝えることができません。Opsgenie のアラートは、限られた文字数に限定されません。アラートにオプションのフィールドを追加し、そこにチャート、ログ、ランブックなどを添付してアラートに情報を加え、受信者が適切なアクションを選択できるようにします。
アラートのカスタマイズと分類
Opsgenie では、アラートメッセージを分かりやすく再設定でき、ソースに関係なく標準化できます。アラートメッセージには追加情報をタグ付けでき、簡単に整理したり、フィルターを適用できます。
カスタムアラートアクション
Opsgenie アプリケーションから直接適切なアクションを開始することでアラートに応答します。アラートに応答するには、「コメントを追加」、「クローズ」などのデフォルトのアラートアクションのほか、調査および是正措置に関するアクションを実行することも可能です。たとえば、ボタンをワンクリックするだけで、接続の確認、サーバーの再起動、またはサービスチケットの作成ができます。
アクションの自動化
発令されたアラートに応答して診断または対策を自動で実行するアクションポリシーを作成します。Opsgenie は、AWS Systems Manager または他のサードパーティー製の自動化プラットフォームと統合し、アラートが事前に定義された条件に一致すると、応答のプレイブックがトリガーされます。つまり、オンコールのエンジニアを介さずにシステムがアクションを実行できるため、大量のアラートによる疲弊を減らし、MTTR を短縮できます。
アラートのライフサイクルの追跡
Opsgenie は各アラートの詳細を追跡して表示します。アラートのアクティビティログには、アラートの作成日時、通知先、通知日時、通知の受信者がアラートを確認したかどうか、またはその受信者が対応したかどうかなど、アラートに関するすべてのアクティビティが含まれます。追跡は、可能な限り特定のユーザーのアクションを介さずにシームレスに実行されます。
アラートポリシーと通知ポリシー
アラートのソース、優先度、時刻に応じて異なる通知を受け取ることで、大量のアラートによる疲弊を防ぎます。Opsgenie は、アラートのコンテンツやタイミングに応じてアラートを抑制、遅延、迅速化する柔軟性を備えています。
Heartbeat
監視システムが正常に機能しアラートを作成しているかどうか、確信するのは難しいものです。Opsgenie の Heartbeat は、監視ツールが有効かつ接続されており、カスタマイズしたタスクが予定どおりに完了したかを確認することで、アラートをエンドツーエンドで確実に機能させます。一定期間に信号がまったく検出されない場合、Opsgenie は問題の発生を即座に警告します。