由于MySQL数据文件过大、达到ext3的2TB文件大小限制,Instapaper完全中止服务31个钟头、然后额外用了整整5天时间(包括周末)拉上Pinterest与亚马逊工程师一起恢复数据。

前不久有网友评价 GitLab 的数据库故障:如果他们使用 AWS 的 RDS 就不会发生这样的故障了。而 Instapaper 这次故障正是因为他们用了 RDS,完全托管,控制权太小,没法知道(或被警报)2TB文件大小限制这回事。平时没有演练恢复数据库备份,没法估计到底要花多长时间才能完全恢复。

分享到: