项目经验_之_事故复盘模版
前言
Github:https://github.com/HealerJean
[toc]
一、故障描述
故障等级:无
起止时间: yyyy-MM-dd HH:mm:ss 至 yyyy-MM-dd HH:mm:ss
责任组/人:xxx
二、故障详情
一句话描述:何时何处发生了什么事情。
三、故障处理过程
-
【发现时间】2020-xx-01 21:26 ,xxx发现有异常。xxx介入排查。
-
【处理时间】2020-07-01 21:38,xxx定位问题,开始xxx。
-
【恢复时间】2020-07-01 21:45,代码回滚完毕。xxx恢复正常。
四、影响与损失
影响:异常。
损失:订单 or 客诉。
五、原因分析
1-Why ?
2-Why ?
3-Why ?
4-Why ?
5-Why ?
六、存在问题
1、
2、
3、
七、故障总结
1、
2、
3、
八、后续 To-do
改进事项 | 负责人 | 地址 | 预计完成时间 | 状态 | 结果验证 | 长期避免 | 备注 |
---|---|---|---|---|---|---|---|
*已完成* | |||||||
*未启动* |
从事前预防、及早发现、快速定位、举一反三等角度,认真思考改进措施,明确需要采取的行动、负责人、时间计划
改进事项应避免空洞无物,符合SMART原则,明确、具体、可执行、可衡量、有确切完成时间。
改进事项完成情况包括:*未开始*、*进行中*、*已完成*、*取消*
如何验证:当前todo项是否彻底完成该如何验证;
长期避免:采取何种措施保证后续不会再出现类似问题;