postmortem-writing

撰写有效的无责复盘报告,包含根本原因分析、时间线和行动项。适用于事件复盘会议、撰写复盘文档或改进事件响应流程。

作者

安装

热度:2

下载并解压到你的 skills 目录

复制命令,发送给 OpenClaw 自动安装:

下载并安装这个技能 https://openskills.cc/api/download?slug=sickn33-skills-postmortem-writing&locale=zh&source=copy

Postmortem Writing - 事故复盘写作指南

技能概述


Postmortem Writing 是一个专用于撰写无责事故复盘文档的技能,提供根因分析方法、时间线模板和行动项制定框架,帮助团队从故障中学习并预防类似事件再次发生。

适用场景


  • 事故后复盘:当生产环境发生 SEV1/SEV2 级别故障、服务中断超过15分钟或出现数据丢失时,使用此技能系统化地撰写事故复盘文档。

  • 复盘会议支持:需要组织并主持无责复盘会议时,技能提供会议结构、引导技巧和讨论框架,确保会议聚焦系统改进而非个人责任。

  • 复盘体系建设:当团队希望建立或改进复盘文化、制定复盘流程规范时,技能提供最佳实践、模板和反模式警示。
  • 核心功能


  • 结构化复盘模板:提供标准事故复盘文档模板,包含执行摘要、详细时间线、根因分析(5 Whys)、检测与响应评估、影响分析和行动项跟踪等完整模块。

  • 无责文化框架:通过对比责备导向与无责导向的差异思维模式,帮助团队建立心理安全感,促进信息共享和组织学习。

  • 根因分析工具:集成 5 Whys 分析法和系统图可视化,指导团队深入挖掘事故根本原因,识别系统性缺陷而非个人失误。
  • 常见问题

    什么是无责复盘?


    无责复盘是一种事故分析理念,核心是将问题归因于系统缺陷而非个人失误。它通过追问"什么条件允许这个问题发生"而非"谁造成了这个问题",来鼓励坦诚沟通、分享教训并改进系统防护机制。

    如何使用 5 Whys 进行根因分析?


    5 Whys 方法是对问题连续追问五次"为什么",直到找到根本原因。例如:服务失败 → 数据库连接耗尽 → 每次请求都开新连接 → 代码绕过了连接池 → 开发者不熟悉代码模式 → 缺乏连接管理文档。最终得出的改进措施是补充文档和测试。

    复盘行动项如何确保落实?


    有效的行动项管理需要四个要素:明确的优先级(P0/P1/P2)、具体的责任人、可验证的交付物和截止日期。建议将行动项录入工单系统跟踪完成状态,并在季度层面回顾跨事故的模式,识别系统性改进机会。