2017/04/26 第899期

写程序去抓取别人网站上的内容是合法的吗

相信很多人都有这样的疑问。同样有疑问的还有:百度、谷歌可以缓存别人的网页,我为啥不可以?别人网站自己写的 Terms of Service 具有法律效应?

如果非要抓取别人网站的内容,最佳实践:有官方 API 的,尽量用官方 API;征求站长的同意;光明正大地在爬虫的 user agent 里写明你是谁、给出网址解释为啥要抓取他们家的内容;咨询律师。

雅虎是如何杀死 Flickr 并输掉整个互联网的

12年前 Flickr 被雅虎收购,之后被迫忙于与雅虎登录系统与雅虎其他产品的整合、加上雅虎大公司官僚体制,当年很酷、很新潮的 Flickr 无法创新,先错过了社交,后错过了移动互联网。

雅虎买下 Flickr 的理由很魔幻:看到 Google 如日中天,雅虎也想搞好搜索;雅虎把 Flickr 看成是一个数据库,一个用户给照片添加了标签的、方便搜索的数据库。Flickr 的用户社区?雅虎不在乎。社交功能?不在乎。iPhone 是 Flickr 上拍照片最多的照相机?管他的。反正 Flickr 就只是一个他妈的数据库!

已经有 Flickr 这么酷的照片分享服务的情况下,Instagram 是怎么做起来的?Instagram 的创始人在创业之初、融资的时候,或许被问了无数次“世界上已经有 Flickr 了,还做了那么多年、有那么多用户了,为何用户还需要另一个照片分享的app?”

停止对 CEO 们的个人崇拜

很多公司的 CEO 都是明星级别的人物,公司运营得好是他/她的功劳、运营得不好也是他/她的罪过;这样的CEO要出什么意外(被车撞了?),公司股价、品牌直接受到冲击。

公司都懂得关键数据要做备份、容灾,但却允许 CEO 成为 single point of failure:)

“免费”的线上服务

不久前纽约时报的那篇“Uber CEO在玩火”的文章里披露,“免费”的方便用户退订邮件的服务 Unroll.me 卖用户数据给 Uber。最好别随便授权任何app去读取你邮箱中的信件。

“if you’re not paying for it, you’re not the customer, you’re the product.” 一方面,人们不能理解为什么看不见摸不着的、没有体积、没法触摸的软件或线上服务是值得付费使用的;另一方面,人们也不认为自己的注意力(看广告)与隐私(卖数据)是比钱更重要的东西。所以,这种“免费”的模式实际上也是很合理的。

当面试官说“你有什么问题要问我吗”的时候

本文准备了一堆问题可以用来向不同身份的面试官(工程师、经理、VP级别的人)提问,能问出好问题在面试中是很加分的。面试是双向的,公司面试你,你也面试公司。