全球访问量前50名的网站 imgur 的工程师总结的经验,很实用:任何东西都加 limit、重试(exponential back-off)、watchdog processes、health checks、冗余、用久经时间考验的工具(不要盲目追求酷炫的新技术)。

我来补充一条:所有与外部第三方API的通讯,都要尽量robust,一定要有监控/警报(请求次数、异常次数、95th percentile访问时间等)。因为第三方API是你没法控制的,不要因为别的公司机器挂了而导致你家的网站也挂了。

分享到: