针对高速团队的事件管理
对事件做出响应
以下部分描述了 Atlassian 的响应事件流程。事件管理员 (IM) 通过这一系列步骤来推动事件从检测到解决的完成。
Jira 字段 | 类型 | 说明 |
摘要 | 文本 | 是什么样的紧急事件? |
描述 | 文本 | 对客户有什么影响?写上您的联系方式,以便响应者与您联系 |
严重性 | 单选 | (超链接到 Confluence 页面,该页面上包含我们的严重性级别)选择 2 级或 1 级意味着您认为必须立即解决该问题 - 相关人员将得到呼叫。 |
故障服务 | 单选 | 出现故障而导致这一事件的服务。如果不确定,请尽量猜测。如果您不知道,请选择“未知”。 |
受影响的产品 | 复选框 | 哪些产品受到了该事件的影响?请选择任何适用的选项 |
创建事件后,其事务键会在有关该事件的所有内部沟通中使用。
客户通常会就影响他们的事件开立支持案例。一旦我们的客户支持团队确定这些案例都与某个事件有关,他们就会使用该事件的事务键为这些案例 贴上标签,以便跟踪客户影响以及在事件得到解决后,更轻松地跟进受影响的客户。
严重性 | 描述 | 示例 |
1 | 产生极大影响的危机事件 |
|
2 | 产生巨大影响的重大事件 |
|
3 | 产生较小影响的小型事件 |
|
确定事件产生的影响后,调整或确认事件事务的严重性,并将该严重性告知团队。我们发现,为级别编号非常有利于明确告知严重性。
在 Atlassian,3 级事件在办公时间移交给交付团队以解决问题,而 1 级和 2 级事件则需要呼叫团队成员立即解决。1 级和 2 级之间的响应差异更细微,并且取决于受影响的服务。
您的严重性列表应记录在案,并在所有团队之间取得共识,以便根据对客户造成的影响对事件进行一致的响应。
内部 Statuspage | 外部 Statuspage | |
事件名称 | <事件事务键> - <严重性> - <事件摘要> | 调查 <产品> 的问题 |
信息 | 我们正在调查影响 <产品 x>、<产品 y> 和 <产品 z> 的事件。我们将立刻通过电子邮件和 Statuspage 提供更新。 | 我们正在调查 <产品> 的问题,并将很快在这里提供更新。 |
除了创建 Statuspage 事件之外,我们还将电子邮件发送给了事件沟通分配列表中的人员,其中包括我们的工程领导、重大事件管理员和其他有关系的员工。该电子邮件中的内容与内部 Statuspage 事件中的内容相同。使用电子邮件,员工可以进行回复和提问,而 Statuspage 更像是单向的广播通信。
请注意,我们总是将事件的 Jira 事务键加入到相关事件的所有内部沟通中,因此员工知道该进入哪个聊天室了解更多问题。