Scaling Dropbox

掌管 Dropbox 后台服务的 Rajiv Eranki 两年前总结的宝贵的实战经验:

  • 平时生成额外的读访问;如果关键时刻服务器撑不住了(比如上了全国性新闻访谈,用户激增),就把额外的读访问停掉,腾出资源。
  • 用简单的 shell script 做数据分析(相信很多人就是这么干的,简单粗暴)。
  • 写代码过程中忘了删掉的 print 语句可能有助于调试 production 中遇到的问题。。。
  • 记录下每次服务器挂掉的时间与原因,一段时间后回头好好看看总结总结。
  • 凡涉及到时间的,一律用 UTC。文中没提到的是,用UTC的一个好处是可以避免夏至时带来的时间变动。
  • 没必要处处严格考虑安全问题。要在易用与网络安全之间权衡取舍。