Close

针对高速团队的事件管理

使混乱恢复秩序:事件指挥官角色

什么是事件指挥官 (IC)?为什么需要?

众所周知,重大事件会对公司利润产生严重影响。因此,事件管理是任何 ITSM 实践中必不可少且不断发展的组成部分。但若发生了事件,谁来负责让系统恢复运行?

一般的答案通常是 IT 或 DevOps。不过,无论由什么部门处理重大事件,掌管解决过程的人通常都是您的事件指挥官

什么是事件指挥官?

事件指挥官也称为事件经理,是负责管理事件响应的 IT 或 DevOps 团队的成员。其首要任务是管理解决方案中涉及的资源、计划和沟通,带领团队尽快彻底解决事件。

消防部门和美国应急小组也使用这个术语,虽然那些场景中风险通常更高,但角色保持相同。事件指挥官始终是对事件相关所有事务拥有最终决定权的关键人物。

为什么团队需要事件指挥官?

事件指挥官是事件的主要联系人和真实情况来源。他们掌握大局,管理所有行动部分,清楚已尝试的步骤和仍关注的对象,并且规划和管理后续行动。

如果没有事件指挥官,沟通和团队合作就支离破碎。团队很容易在不知不觉中做重复的工作,错过大局问题,而且不能快速、准确地与系统用户、内部利益相关者、领导层以及彼此之间进行沟通。组织的技术或团队结构越大、越复杂,此角色对于健康事件管理实践就越重要。

事件指挥官的职责

事件准备

事件指挥官负责建立沟通渠道,在事件发生时邀请适当的人员进入这些渠道,并就事件管理最佳实践和事件期间沟通为团队成员提供培训。

决策制定

IC 负责快速评估事件,并就解决过程的每个阶段应做什么、需要哪些团队成员参与以及接下来采取什么行动做出决定。他们应当是良好的倾听者,擅于收集、综合和优选专家建议。

优秀的事件指挥官是自信的决策者,具有强悍的问题解决能力。

委派任务

IC 必须将任务委派给所在的团队,并且知道何时应通过将更多开发人员和沟通专家拉入团队来扩大队伍。

监督状况

开发人员忙于思考是何原因导致事件发生以及如何解决代码中的问题,而事件指挥官则应着眼于大局。已尝试了什么?上次怎么解决的?如果当前策略不起作用,下一个最佳步骤是什么?

事件指挥官负责从头到尾监督整个过程,提出正确的问题,定期从每个团队成员获取状态报告,并且确定后续步骤的优先顺序。

校准团队

事件越大,越有可能让多个团队来共同解决问题。IC 负责监督沟通,并确保所有人步调一致。他们还应使对话保持专注和简短,最大限度缩短解决问题的时间。

管理恐慌

事件是高风险、高压力的活动;研究表明,人们在面临压力时会做出糟糕的决定。所以,事件指挥官的部分工作是确保团队保持冷静和专注。

IC 应能够并且愿意从事件团队撤退高度紧张的人员,在需要时平复团队情绪,始终将注意力引回到手头的任务上。若有可能,他们还应该阻挡从内部和外部利益相关者不断涌来的问题和恐慌,减轻团队的额外负担。

上报和资源管理

必要时,事件指挥官负责将问题上报给更高级别或更为专业的开发人员,并且/或者引入更多资源来加快解决速度。

规划

无论是在事件发生之前还是期间,IC 都应准备好后续步骤和备用计划。

事后

事件解决之后,事件指挥官将负责事后分析流程,包括创建文档供团队分享想法、策划事后分析会议,以及就如何预防或减轻未来事件影响提出建议。

成为事件指挥官

事件指挥官的核心职责是管理资源、进行沟通和解决问题。从高层领导一直到实习生,任何具备这些技能的人都可以成为出色的事件指挥官。

事件指挥官应满足的要求通常包括:

  • 较强的沟通能力
  • 深入掌握事件管理最佳实践和系统
  • 问题解决能力
  • 能够快速、自信地做出决策
  • 倾听和综合技能
  • 与重大事件相关的经历(不论是作为参与者还是关注者)
  • 领导能力 — 高压下指挥的能力

在成为事件指挥官之前,大多数公司都会让您观摩其他 IC 来熟悉门道。这时,最佳做法是静静地观察和学习,等到事件得以解决后再提出心中的疑问。

事件指挥官的最佳实践

采用行业最佳实践

事件指挥官负责指导团队成功处理事件,因此他们要对事件响应事件沟通最佳实践了如指掌。Atlassian 的《事件管理手册》是另一个实用的资源。

提前规划

在事件发生之前制定战略计划也是至关重要的。事件发生前准备的流程文档越完善,IC 和团队就越容易在事件造成的激烈、高压环境中遵循流程。

了解您的团队

了解团队动态以及团队成员的强项和弱点,可以更好地委派任务,更快地解决事件。

坚守任务

即便在重大事件中,团队通话和 Slack 对话也可能会出现离题。IC 应该准备好阻止偏离轨道,将团队注意力重新集中到手头的任务上。

有时,这只需要口头或书面提醒一下。另一些时候,这意味着要在团队中撤出旧人或引入新人。优秀的 IC 甚至也愿意将造成注意力分散的 CEO 或上司从通话中踢走。

保持冷静

优秀的 IC 能够在危机中保持冷静和专注。这要么是 IC 天生具备的能力,要么就是可以练习和改进的。

优先事后分析

事件解决之后,IC 应该进行不加责难的事后分析,以确定团队将来如何改进事件管理和总体系统。优秀的 IC 不仅能冷静地引导事件朝着解决方向发展,还会奋力帮助公司从事件中吸取教训并做出改进。

总结

每个事件指挥官都可从强大的服务管理解决方案受益。Jira Service Management 可以加强沟通、集中警报,并整合知识库文章。

Up Next
Aviation