Google 如何备份整个互联网的

使用磁带存储,在磁带上做 RAID4(4个磁带做XOR放到第5个磁带上)。这个哲学好:备份数据的目的是为了数据恢复,宁可备份操作复杂耗时,也要争取数据恢复时的快速方便。

2011年的时候,一个代码的 bug 让 Gmail 的 0.02% 的用户丢数据,Google 用了几天时间从磁带恢复了这 0.02% 的用户的数据,如果是其他公司的话,故居这些数据早就永远消失、或者需要恢复几个月了。

磁带?对,OracleIBM 都还在卖磁带存储系统。Amazon 的 Glacier 服务可能也是基于磁带的,但外界都只是猜测。