On-Call Handoff Patterns - 值班交接最佳实践指南

On-Call Handoff Patterns - 值班交接最佳实践

技能概述

On-Call Handoff Patterns 提供值班交接的完整模式和方法，帮助团队实现高效的上下文转移、规范的升级流程和完善的文档体系，确保值班交接无缝衔接。

适用场景

1. 值班责任转移

当你需要将 on-call 责任从一位工程师转移给另一位工程师时，使用此技能可以确保：

当前问题和调查进度得到完整传递

接任者快速了解系统状态和潜在风险

升级路径和联系人信息清晰明确

2. 编写交接文档

无论是日常交接还是事故处理中的紧急交接，该技能提供：

结构化的交接文档模板（详细版/快速版/事故专用）

清晰的组件清单（活跃事故、调查中问题、近期变更等）

经实践验证的格式和字段

3. 建立 on-call 流程

对于需要从零建立或改进值班流程的团队：

交接时间安排建议（30分钟重叠窗口）

交接前中后的完整检查清单

同步与异步交接的适用场景

核心功能

1. 交接文档模板

提供三种开箱即用的模板：

详细交接文档：适合日常完整交接，包含活跃事故、调查中问题、已解决问题、近期变更、已知问题、即将到来的事件等完整信息

快速异步交接：适合时间紧迫或跨时区团队，聚焦关键信息和待关注事项

事故中交接：专为 SEV1/SEV2 事故设计，确保关键信息在压力环境下不丢失

2. 交接流程设计

包含经过验证的最佳实践：

30分钟交接重叠窗口的合理分配

交接双方的职责清单（15分钟文档编写 + 15分钟同步沟通）

交接前中后的完整检查流程

升级触发条件和路径

3. 检查清单和快速参考

提供实用的操作指南：

班前准备清单（VPN、kubectl、数据库访问、告警设置）

班中日常流程（晨检、全天监控、日终交接）

班后收尾清单（文档更新、工单关闭、复盘归档）

常用命令速查和重要链接集合

常见问题

on-call handoff 应该包含哪些内容？

一份完整的交接文档应包含五个核心组件：活跃事故（当前正在处理的问题）、调查中问题（正在调试但未解决的事项）、近期变更（部署、配置修改）、已知问题及临时解决方案、即将到来的事件（维护窗口、版本发布）。此外还应包含升级路径、常用链接和检查清单。

值班交接需要多长时间？

建议安排 30 分钟的交接重叠窗口。其中交班工程师用 15 分钟编写交接文档，接班工程师用 15 分钟提前阅读；双方再进行 15 分钟的同步沟通。对于复杂环境或事故交接，可能需要更长时间。快速异步交接可在 5-10 分钟内完成，但不建议作为常规做法。

如何避免交接遗漏重要信息？

使用结构化模板是避免遗漏的关键。该技能提供的三种模板都经过实战验证，覆盖所有必要信息点。同时，"交班检查清单"和"接班检查清单"确保双方都不会忘记关键步骤。保持同步沟通（而非纯异步交接）也能通过问答澄清潜在遗漏。建议定期审查和更新交接流程，根据团队实际情况调整模板内容。

on-call-handoff-patterns

作者

分类

安装