每天推送5篇优质英文文章 · By makers, for makers

运营 1203 天, 推荐好文 5,340 篇, 原创简评 1,090,212 字, 原文总阅读时间 47,060 分钟, 153,624 人订阅

(有读者反映原链接打不开,我不确定是否是被墙了。打印成pdf放在这里:https://nfil.es/w/c7Idrp/) 系统出现故障是很正常的事情,但要做好事后的事故分析、经验终结,看是自身问题(人为操作的失误、系统设计的缺陷、监控没到位没有及时警报),还是第三方服务的问题(以后如何把风险降到最低)。在事故分析中,很容易出现点名道姓地互相指责、互相推卸责任的情况。该如何避免这种情况?
分享到: