每天推送5篇优质英文文章 · By makers, for makers

运营 1170 天, 推荐好文 5,220 篇, 原创简评 1,069,606 字, 原文总阅读时间 45,921 分钟, 149,240 人订阅

Instagram最近挺红火的,推出Hyperlapse app,声势浩大。今天下午(美国太平洋时间),网站和app全面访问不了。网站很快就恢复正常,但app挂了将近2个小时。他们官方twitter更新了消息,告诉用户他们出现技术问题(现在那条tweet已经删除了)。我的猜测:可能某个很关键的infrastructure component(比如memcached、postgres或者zookeeper之类的)出了问题,由于人为的操作失误或今天release新代码引入了bug之类的,才会同时影响到网站和app(api的部分)。 挂了2个小时是挺严重的事故。一般情况下,服务的SLA(service level agreement)都要求99.5%的时间服务是可以访问的(有的更严格会要求99.95%)。以99.5%算得话,这意味着一个月最多只能挂掉3.6个小时。今天挂了2个小时,那这个月其他时间就只有1.6个小时可以出问题了:) 碰巧的是,3天前,StackOverflow网站也挂了几分钟,我当时正好截图下来了(留做纪念?):https://nfil.es/a/tptynY.png/
分享到: